要約
日本企業でもPythonを活用しているところが増えてきています。
今回は、Pythonを利用したデータ分析に力を入れている楽天株式会社を紹介します。
楽天では、オンラインショッピングモールでの商品販売データの分析や顧客行動予測など、Pythonを利用したデータ分析に積極的に取り組んでいます。
ここでは、楽天が公開しているPythonツールを使った例を見ていきましょう。
詳細内容
楽天では、Pythonを利用した様々なデータ分析に取り組んでいます。
例えば、オンラインショッピングモールの商品販売データの分析や顧客行動予測などに活用しています。
そこで、楽天が公開しているPythonツールを紹介します。
まずは、「Rakuten RapidAPI」というAPIマーケットプレイスと連携するPythonモジュール「rakutenapi」を紹介します。
このモジュールを使うことで、楽天の商品検索APIや書籍検索APIなどを簡単に呼び出すことができます。
以下は、書籍検索APIを利用して、Pythonの書籍を検索する例です。
“`python
from rakutenapi import RakutenAPIapi = RakutenAPI()
result = api.execute(‘BooksBookSearch’, {
‘applicationId’: ‘YOUR_APPLICATION_ID’,
‘title’: ‘Python’,
})for book in result[‘Items’]:
print(book[‘Item’][‘title’])
“`上記のコードでは、楽天の書籍検索APIである「BooksBookSearch」を呼び出しています。
APIを呼び出す際には、APIキー「YOUR_APPLICATION_ID」を指定する必要があります。
また、検索条件として「title」に「Python」というキーワードを指定しています。
取得結果は、JSON形式で返されます。
「Items」には、検索結果の1ページ分のデータが含まれていますので、必要に応じてページ数を指定して繰り返し処理を行うことができます。
次に紹介するのは、「rakutenma」というPython用形態素解析ライブラリです。
このライブラリを使うことで、日本語の文章を単語に分割することができます。
以下は、楽天市場の商品レビューから形態素解析を行い、単語を出力する例です。
“`python
import rakutenmarma = rakutenma.RakutenMA()
text = ‘この商品はとても良かったです。
‘result = rma.tokenize(text)
for node in result:
print(node.surface)
“`上記のコードでは、「RakutenMA」クラスを使用して形態素解析を行っています。
解析する文章は、変数「text」に代入されています。
「result」には、形態素解析結果がリスト形式で格納されます。
「surface」には、単語が文字列で格納されています。
最後に紹介するのは、「rakutentech」という楽天技術研究所が開発したPythonツールです。
このツールを使うことで、楽天の商品販売データの分析や顧客行動予測などができます。
以下は、クラスタリング分析を行う例です。
“`python
from rakutentech.dal import DAL
from rakutentech.clustering import Cluster# データ取得
dal = DAL(user=’USER’, password=’PASSWORD’, database=’DATABASE’)
data = dal.query_as_data_frame(‘SELECT * FROM SalesData’)# クラスタリング分析
cluster = Cluster()
cluster.fit(data, n_cluster=3)# クラスタリング結果を表示
labels = cluster.model.labels_
print(labels)
“`上記のコードでは、「DAL」クラスを使用して、データベースから商品販売データを取得しています。
取得したデータは、PandasのDataFrame形式で格納されています。
次に、「Cluster」クラスを使用して、クラスタリング分析を行っています。
「n_cluster」には、クラスタ数を指定しています。
最後に、クラスタリング結果を取得して表示しています。
以上が、楽天が公開しているPythonツールの紹介です。
これらのツールを利用すれば、Pythonを使ったデータ分析に役立てることができます。
コメント