Webブラウザを介さずに「スクレイピング」という手法でコンテンツ情報を取得するツール、Firecrawlを試してみます。
はじめに
前回と前々回は、browser-useに関する記事を投稿し、AIが自律的にWebブラウザを使ってコンテンツ情報を取得する仕組みについて解説しました。今回は、Webブラウザを介さずに「スクレイピング」という手法でコンテンツ情報を取得するツール、Firecrawlを試してみます。
ただし、「スクレイピング」は誤った使い方をすると他のWebサイトに迷惑をかけたり、トラブルを引き起こす可能性があります。そのため、ご自身が管理しているWebサイトや利用許可を得たサイトでのみ実施するようにしてください。
それでは、Firecrawlを使ったスクレイピングに挑戦してみましょう!
2時間
10,000 円
2024年12月31日
※この制作物は生成AIを活用しています
生成AIやってます!Qiitaで記事を投稿しているので、評価のインプットにしていただけると幸いです。
■ プログラム言語
[VBA(Excelマクロ)]
VBAについては(特にExcel)自信を持っています。
必ずご要望にこたえます。
[生成AI]
また、最近は「Python」と「LangChain」を使ったプログラムを作成しており、電子帳簿保存法に伴うPDFファイル名称の自動付与や、画像認識もやっています。
■ サーバ構築・インフラ
AWSやAzureなどのクラウドにサーバを低価で構築することができます。
■ 方針について
要件のすり合わせについても、お客様が満足いくよう、丁寧に受け答えをいたします。
是非よろしくお願いします。
■ 投稿記事
また「Python」や「LangChain」を適用した、生成AIに関する記事をQiitaに投稿しています。
是非ご覧ください。ユーザ名は「ogi_kimura」です。