- お役立ち記事
- データ操作の基本(Pandas)
データ操作の基本(Pandas)
目次
はじめに
製造業の現場では、データがますます重要な役割を果たしています。
特に、調達購買や生産管理、品質管理を効率的に行うためには、膨大なデータを正確に扱い、分析し、意思決定に役立てることが求められます。
Pythonはその過程で便利なツールとして広く使われており、中でもPandasはデータ操作に特化した強力なライブラリです。
本記事では、製造業のプロとしてデータ操作の基本を理解し、実践に活かすために、Pandasを活用したデータ操作の基本について解説します。
Pandasとは
PandasはPythonでデータ処理を簡素化し、効率化するためのライブラリです。
データフレームという専用のデータ構造をもち、Excelのスプレッドシートのような形式でデータを扱えます。
行や列を使ったデータ操作が容易で、データのクリーニングやフィルタリング、統計分析、ビジュアライゼーションまで幅広い用途に対応しています。
Pandasはデータ分析や処理を行うにあたり多くの機能を提供し、製造業においても有用なツールです。
なぜPandasが製造業に役立つのか
製造業では、日々さまざまなデータを扱います。
発注データ、在庫状況、生産計画、品質検査結果など、整備管理されたデータが業務効率化には欠かせません。
従来のアナログ的な手法では、これらのデータをスピーディかつ正確に処理することには限界があります。
Pandasを用いることで、複数のデータセットを結合したり、特定の条件に基づいたデータ抽出を瞬時に行ったりと、生産性を大きく向上させることが可能です。
Pandasの基本機能
Pandasにはさまざまな機能がありますが、ここではデータ操作の基本を押さえるために主な使い方を紹介します。
データの読み込みと出力
Pandasは多種多様なデータ形式に対応しています。
例えば、CSVファイル、Excelファイル、SQLデータベースなどからデータを読み込めます。
以下は、CSVファイルをデータフレームとして読み込む例です。
“`python
import pandas as pd
# CSVファイルを読み込む
df = pd.read_csv(“data.csv”)
“`
また、データフレームの内容をCSVやExcelファイルに出力することも可能です。
“`python
# データフレームをCSVファイルとして保存
df.to_csv(“output.csv”, index=False)
“`
データの確認と前処理
データ分析の前には、データの内容を確認し、欠損値の補完や不要なデータの削除などの前処理を行うことが重要です。
“`python
# データフレームの先頭5行を確認
print(df.head())
# 欠損値の確認
print(df.isnull().sum())
# 欠損値を特定の値で補完
df.fillna(0, inplace=True)
“`
データの選択とフィルタリング
必要なデータだけを取り出すことができるので、効率的な分析が可能です。
“`python
# ‘status’列が’completed’の行を取得
completed_orders = df[df[‘status’] == ‘completed’]
# 複数条件の適用
filtered_data = df[(df[‘quantity’] > 10) & (df[‘category’] == ‘electronics’)]
“`
データの集計と統計
製造業におけるデータ分析では、データの集計や統計値の算出もよく行われます。
“`python
# ‘category’ごとの平均値を計算
category_mean = df.groupby(‘category’).mean()
# 個数の最大値
max_quantity = df[‘quantity’].max()
“`
Pandasを用いた実践事例
次に、Pandasが具体的にどのように製造業の現場で役立つのか、実践的な例を紹介します。
在庫管理の最適化
在庫データをPandasで処理することで、品切れや過剰在庫を防ぐための有用な分析を行えます。
例えば、以下のように在庫回転率や在庫予測を計算することができます。
“`python
# 在庫回転率の計算
df[‘inventory_turnover’] = df[‘sales’] / df[‘inventory’]
# 予測モデルを使った在庫予測(概要)
# ARIMAモデルや機械学習アルゴリズムを組み合わせ、今後の需要を予測可能
“`
品質管理のデータ分析
品質管理の分野でも、検査結果や不良品データの分析にPandasを活用できます。
データを整理し、問題のあるプロセスを特定し、改善策を講じることが可能になります。
“`python
# 品質検査結果の集計
defective_counts = df.groupby(‘defect_type’).size()
# 異常検知(Zスコアの算出)
df[‘z_score’] = (df[‘measurement’] – df[‘measurement’].mean()) / df[‘measurement’].std()
outliers = df[df[‘z_score’] > 3]
“`
おわりに
製造業の現場でデータの重要性が増す中、Pandasは非常に有用なツールです。
データを正確に把握し、迅速に意思決定する力を与えてくれます。
効率的な在庫管理や品質管理のために、Pandasを積極的に活用し、より良い製造プロセスの実現を目指していきましょう。
この知識と技術が、製造業のさらなる発展に貢献することを期待します。
資料ダウンロード
QCD調達購買管理クラウド「newji」は、調達購買部門で必要なQCD管理全てを備えた、現場特化型兼クラウド型の今世紀最高の購買管理システムとなります。
ユーザー登録
調達購買業務の効率化だけでなく、システムを導入することで、コスト削減や製品・資材のステータス可視化のほか、属人化していた購買情報の共有化による内部不正防止や統制にも役立ちます。
NEWJI DX
製造業に特化したデジタルトランスフォーメーション(DX)の実現を目指す請負開発型のコンサルティングサービスです。AI、iPaaS、および先端の技術を駆使して、製造プロセスの効率化、業務効率化、チームワーク強化、コスト削減、品質向上を実現します。このサービスは、製造業の課題を深く理解し、それに対する最適なデジタルソリューションを提供することで、企業が持続的な成長とイノベーションを達成できるようサポートします。
オンライン講座
製造業、主に購買・調達部門にお勤めの方々に向けた情報を配信しております。
新任の方やベテランの方、管理職を対象とした幅広いコンテンツをご用意しております。
お問い合わせ
コストダウンが利益に直結する術だと理解していても、なかなか前に進めることができない状況。そんな時は、newjiのコストダウン自動化機能で大きく利益貢献しよう!
(Β版非公開)