Pythonの活用事例:Webスクレイピングとデータ分析の実際のコード

python

概要

近年、日本のIT企業でもPythonの活用が進んでいます。

Pythonはシンプルな文法と広範なライブラリの豊富さから、多くの企業でプログラム開発やデータ分析などに活用されています。

ここでは、実際の企業事例を通して、Pythonの活用方法やコードの一例を紹介していきます。

詳細内容

【事例1:Webスクレイピング】
Pythonを活用したWebスクレイピングの一例として、以下のコードを紹介します。

このコードは、PythonのライブラリであるBeautifulSoupとRequestsを使用して、指定したウェブページから記事のタイトルとURLを取得するものです。

import requests
from bs4 import BeautifulSoup# スクレイピング対象のURL
url = "https://www.example.com"# HTTPリクエストを送信してHTMLを取得
response = requests.get(url)
html = response.text# BeautifulSoupオブジェクトを作成
soup = BeautifulSoup(html, "html.parser")# 記事のタイトルとURLを取得して表示
for article in soup.find_all("article"):
    title = article.find("h2").text
    url = article.find("a")["href"]
    print(f"タイトル:{title}")
    print(f"URL:{url}")
    print()

このコードでは、まず`requests`モジュールを使って指定したURLからHTMLを取得します。

次に、取得したHTMLを`BeautifulSoup`オブジェクトに変換して、指定した要素を取得します。

ここでは、記事を示す`article`要素の中からタイトルとURLを取得しています。

最後に、取得したタイトルとURLを表示しています。

このようにPythonを使ったWebスクレイピングは、情報収集やデータ収集など様々な場面で活用されています。

【事例2:データ分析】
PythonのライブラリであるPandasとMatplotlibを使ったデータ分析の一例として、以下のコードを紹介します。

このコードは、CSVファイルからデータを読み込み、折れ線グラフとヒストグラムを作成するものです。

import pandas as pd
import matplotlib.pyplot as plt# データの読み込み
df = pd.read_csv("data.csv")# 折れ線グラフの作成
plt.plot(df["日付"], df["数値"])
plt.xlabel("日付")
plt.ylabel("数値")
plt.title("データの推移")
plt.grid()
plt.show()# ヒストグラムの作成
plt.hist(df["数値"], bins=10)
plt.xlabel("数値")
plt.ylabel("出現回数")
plt.title("データの分布")
plt.grid()
plt.show()

このコードでは、`pandas`モジュールを使ってCSVファイルからデータを読み込みます。

その後、`matplotlib`モジュールを使って折れ線グラフとヒストグラムを作成しています。

折れ線グラフでは、日付をx軸、数値をy軸に表示しています。

ヒストグラムでは、数値の分布を表示しています。

Pythonのデータ分析ライブラリを使えば、データの可視化やデータ処理などを効率的に行うことができます。

以上が、実際の企業でPythonを活用したコードの一例です。

Pythonの柔軟な文法と豊富なライブラリを駆使して、さまざまな業務に活用できることがわかります。

コメント

タイトルとURLをコピーしました