-
Webサイト内検索用のクローラー開発
■ プロジェクトの目的
Webサイト内検索用のクローラー開発。
トップページをクローリングしてURL、ページタイトル、本文、更新日時を取得しリストを作成。PDFの情報も取得する。
■ 体制・人数
1人
■ 自分のポジション・役割
エンジニア。開発業務
■ 目的を達成する上での課題
トップページから必要なコンテンツ情報をDBに登録すること。
■ 課題に対して取り組んだこと
検索サイトに使用するデータなので、検索用のデータとして意味のある部分だけを取得したいサイトのヘッダー、サイドメニュー、フッターなど他のページと同じ部分は不必要な情報として削除する
■ ビジネス上の成果
また開発途中です。