≪概要≫
音声ファイルを音声テキスト化APIのWhisperにより自動でテキスト化し、議事録のドキュメントとして出力するPythonスクリプトです。音声ファイルWhisperの処理可能ファイルサイズ上限の25MB以下になるよう分割し、生成された分割テキストを統合したのち、ChatGPTにより議事録を生成し、最終的なアウトプットとして保存します。特に、会議の議事録やインタビューのテキスト化など、長い音声を効率よく処理することを目的としています。
≪主な機能≫
・音声ファイルの分割:20MBごとに音声ファイルを分割し、処理しやすいサイズにします。
・音声のテキスト化:OpenAIのWhisperモデルを使用して、音声をテキストに変換します。
・テキストの統合:複数のテキストファイルを統合し、一つのファイルとして出力します。
・議事録生成:ChatGPTを使用して、会話内容を元に議事録を生成し、読みやすくまとめます。
1ヶ月
100,000 円
2024年10月16日
※この制作物は生成AIを活用しています
生成AIを用いた多様なシステムの開発実績有り!相談無料です。まずはアイデアについてお話ししましょう!
【略歴】
大学・大学院でAIによる画像処理の研究やレーザー機器制御による物理メモリの研究を行った後、外資系大手ITコンサルティング会社に入社。
日系大手航空会社の大規模システム移管プロジェクトにソリューションエンジニアとして参画し、乗客・荷物の計数システムや航空便の緊急停止通達システムを始めとした複数の航空系システム開発に従事。
現在はAIエンジニアとして、不動産業界や人材業界向けに業務効率化のためのRPAシステムやAIによる業務代替システムの開発と導入を行っています。
【対応可能案件について】
簡単なスクレイピングやブラウザ自動操作システムやWeb制作から、画像処理、音声認識、音声合成、自然言語処理をはじめとする様々なAI技術を用いたシステムの開発まで様々対応可能です。
基本的には私個人での開発となりますが、大規模案件や急ぎの案件については、必要に応じて開発者チームを編成し、安価でスピーディーな対応が可能です。
一般的なHPやECサイト制作であっても対応可能です。
【資格・検定】
AWS 認定クラウドプラクティショナー 取得年 : 2022年
【語学力】
英語 : ビジネス会話レベル
【ご相談について】
現状当サイトでの受注経験に乏しく、実績作りの意味で比較的安価でのサービスの提供が可能です。
プロジェクトの内容や条件についてのご相談は無料で行っておりますので、是非お気軽にご連絡ください。