-
Pythonを用いた大規模データの分析および予測AIモデルの開発
■ プロジェクトの目的
膨大な過去データ(時系列データ)からの法則性発見と、高精度な予測モデルの構築。
■ 体制・人数
1名(個人開発)
■ 自分のポジション・役割
AI開発エンジニア(データ収集、前処理、バックテスト、フォワードテスト環境構築)
■ 課題に対して取り組んだこと
数十万件以上の過去データをスクレイピング等で収集し、Pandas等を用いて高度なデータクレンジング・前処理を実行。その後、独自のアルゴリズムを用いた予測AIを構築し、過去データを用いた徹底的なバックテストおよび、実践環境でのフォワードテストによる精度検証を行っています。
■ ビジネス上の成果
複雑なデータをシステムで処理・分析し、客観的な数値に基づく予測モデルをゼロから設計・実装できる高度なデータ処理能力を確立しています。
-
YouTube Data APIを活用したチャンネルデータの自動抽出・リスト化システム開発
■ プロジェクトの目的
手作業で行われているインフルエンサーのリサーチやリスト作成業務の完全自動化と、ヒューマンエラーの削減。
■ 体制・人数
1名(個人開発)
■ 自分のポジション・役割
開発エンジニア(要件定義、プログラミング、テスト全般)
■ 目的を達成する上での課題
手作業では数日かかる大量のデータ収集を圧倒的にスピードアップさせること。また、クライアントが求める質の高いデータ(特定の再生数以上など)のみを正確に抽出し、重複のない綺麗なリストとして整理すること。
■ 課題に対して取り組んだこと
PythonとYouTube Data APIを活用し、指定条件のチャンネルを自動抽出するスクリプトをゼロから構築しました。さらに、取得した生データをデータ分析ライブラリ(Pandas)を用いて成形・重複排除し、誰でも見やすいCSV形式で出力する機能を実装しました。
■ ビジネス上の成果
手作業では数日かかるデータ収集作業を「数分」で完了させることに成功しました。これにより、リスト作成における大幅な業務効率化と、人的ミスのない高精度なデータ納品を実現しています。
Python, API連携, データ分析, スクレイピング