「PandasとMatplotlibライブラリを使ったデータ解析のPythonコードと、BeautifulSoupとrequestsライブラリを用いたWebスクレイピングのPythonコードの例」

python

概要

Pythonは、シンプルでわかりやすい文法と豊富なライブラリが特徴のプログラミング言語で、日本の企業でも広く活用されています。

データ分析や機械学習など、あらゆる分野で利用される汎用性の高い言語です。

詳細内容

例1: データ解析用のPythonコード以下は、PandasとMatplotlibライブラリを用いたデータ解析用のPythonコードです。

具体的には、CSVファイルからデータを読み込み、集計や可視化を行います。

# 必要なライブラリを読み込む
import pandas as pd
import matplotlib.pyplot as plt# データをCSVファイルから読み込む
data = pd.read_csv('data.csv')# データの概要を表示する
print(data.head())# データの統計情報を表示する
print(data.describe())# データのカラムごとに平均値を計算する
means = data.mean()# 平均値を可視化する
plt.bar(means.index, means.values)
plt.title('平均値')
plt.xlabel('カラム')
plt.ylabel('平均値')
plt.show()

このコードでは、Pandasライブラリの`read_csv()`関数でCSVファイルからデータを読み込み、頭数の`head()`関数や統計情報の`describe()`関数でデータの概要を確認しています。

また、`mean()`関数でデータの各カラムごとに平均値を計算しています。

最後にMatplotlibライブラリを用いて平均値をグラフ化しています。

例2: Webスクレイピング用のPythonコード以下は、BeautifulSoupとrequestsライブラリを用いたWebスクレイピング用のPythonコードです。

具体的には、Yahoo!ニュースのトップページからタイトルとURLを取得します。

# 必要なライブラリを読み込む
from bs4 import BeautifulSoup
import requests# URLからHTMLを取得する
url = 'https://www.yahoo.co.jp/'
res = requests.get(url)
html = res.text.encode(res.encoding).decode('utf-8')# BeautifulSoupでHTMLをパースする
soup = BeautifulSoup(html, 'html.parser')# タイトルとURLを取得する
titles = []
urls = []
for a in soup.find_all('a', class_='newsFeed_item_link'):
    titles.append(a.text)
    urls.append(a['href'])# タイトルとURLを表示する
for i in range(len(titles)):
    print(titles[i])
    print(urls[i])

このコードでは、requestsライブラリの`get()`関数でYahoo!ニュースのトップページのHTMLを取得し、BeautifulSoupライブラリの`find_all()`関数で``タグの要素を抽出しています。

そして、タイトルとURLを`append()`関数で順にリストに格納しています。

最後に`for`ループでタイトルとURLを表示しています。

コメント

タイトルとURLをコピーしました