Python によるデータサイエンスと機械学習をします
業務内容
データは企業の主な資産です。より良いデータ、より良い決定を下すことができます。データサイエンスは、データを分析するためのツールを提供する分野です。これには、データの準備と探索、データの表現と変換、データの視覚化、プレゼンテーション、予測分析など、いくつかのサブディビジョンが含まれています。
➡︎だから、あなたの厄介なデータを貴重で意思決定可能なものにしてくれる人を探しているなら、私はあなたを助けるためにここにいます。
【プロジェクトのための私のスキルリスト】
・Python
・Numpy
・Pandas
・Matplotlib
・Seaborn
・Folium
・Scikit-learn
【データの前処理】
・欠落データの処理
・データ補完
・分類のラベルエンコーディング
・カテゴリデータの処理
・特徴変換の手法
・特徴エンジニアリング
【データビジュアライゼーション】
・Matplotlib
・Plotly
・Seaborn
・Folium
【機械学習】
・線形回帰
・ロジスティック回帰
・K 最近傍 (KNN)
・デシジョンツリー分類子
・ランダムフォレスト分類子
・サポートベクターマシン
・ベイズアルゴリズム
ご興味持っていただけましたら、メッセージでお気軽にお声がけください。
どうぞ宜しくお願いいたします!
現役データアナリストがExcel・csvデータの前処理・クレンジングをします
業務内容
【顧客データがもっと見やすくなれば、売り上げ予測できるかもしれないのに…】
あなたのお仕事において、欠損値や半角/全角スペース、日付の表記法などが入力者によってバラバラで、分析に使えそうにないと判断されているようなデータはありませんか?
使えないと一蹴して削除する前に、そのデータ、私に綺麗にさせてくれませんか?
機械学習全盛のこの時代、Excelやcsvのデータは顧客の購買予測などに応用できる、いわば宝の山です。そのデータがもし見やすく、またPCによる分析のしやすい形となれば、未開拓の商機を見いだすことができるかもしれません!
私は東大で心理学を専攻し、実験データの扱いや統計解析手法に慣れ親しみました。さらに旧帝大医学部に再入学し、独学でデータ分析手法を学ぶほか、機械学習を医学研究に応用する研究室での研究従事、さらには統計検定準1級を最優秀成績賞で取得しました。
実務ではデータ分析企業でのインターンにて自動車部品の性能データ分析、さらに大学医学部での医学研究データ分析を経験。貢献が認められ医学部論文への氏名掲載に至りました。
経験例:
データクレンジング、分散分析、相関係数の算出、ロジスティック回帰分析、重回帰分析、t検定、カイ二乗検定、赤池情報量基準の算出、scikit-learn ならびにxgboostによる機械学習モデル、ノンパラメトリック検定など
ご購入前にDMにて簡単に依頼内容をご相談ください。差し支えなければデータをお送りいただけますと幸いです。
ぜひ私におまかせください!
- 業務
- 人工知能・機械学習
- 手法
- 機械学習 教師あり学習 決定木分析 線形回帰
- テクノロジー
- Python R Scikit Learn Jupyter Notebook