【Python】5ちゃんねるの情報をスクレイピングの仕事・依頼・料金 | Webシステム開発・プログラミングの仕事 【クラウドソーシング ランサーズ】[ID:2553462]

サイトマップ
For 発注者
テレビCM放映中! テレビCM放映中!
この募集は終了しました。

【Python】5ちゃんねるの情報をスクレイピングの仕事

見積もり募集の結果

募集期間

6日間

提案数

12件

閲覧数

278回

実際の発注内容

依頼の予算
5,000 円 ~ 10,000
実際の支払金額
6,000 円 ~ 7,000
製作期間
3
実際の受注者
tsubakuro
tsubakuro

シルバー 認証済み、受注実績あり、評価が高く活躍中のランサーです Python、深層学習、機械学習

  • 希望時間単価 5,000円~
  • 実績 1
  • 評価 5.0
  • プロジェクト完了率 100%
  • 機密保持
  • 本人確認
  • 電話

▼可能な業務/スキル ・Pythonコーディング ・AWSシステムデザイン ・LINEチャットボット開発 ・マシンラーニング、ディープラーニングのモデルプロトタイプ作成 ▼実績例 ・Web上のデータのスクレイピング、クローラー作成 ・ディープラーニングのモデルプロトタイプ作成 ・LINEの飲食店向けチャットボット開発 ▼活動時間/連絡について できる限り柔軟に... 続きを読む

スキル
Python
Linux
C++
... もっとみる
発注者の声

見積もり募集の内容

依頼の目的・背景
5ちゃんねるの情報をスクレイピングできる
プログラムを2つ作成していただきたいです。

①url情報の収集
- 入力
下記例のようなurlの1つを入力
http://mevius.5ch.net/eleven/subback.html
https://medaka.5ch.net/job/subback.html
https://egg.5ch.net/koukoku/subback.html

- 出力
下記形式のcsvファイル
------------------------------------------------------------
id,title,count,url
------------------------------------------------------------
countはタイトル横に()で記載されている書き込み数
なお、タイトルから(書き込み数)は削除お願いします。

②書き込み情報の収集
- 入力
下記例のようなurlの1つを入力

https://egg.5ch.net/test/read.cgi/koukoku/1329425574/
https://medaka.5ch.net/test/read.cgi/job/1564976160/
https://rio2016.5ch.net/test/read.cgi/hage/1564476516/

- 出力
下記形式のjsonファイル
------------------------------------------------------------
{
"title": "○○について語るスレ",
"content": [
{
"threadid": 1,
"name": "名無しさん",
"time": "2012/02/17(金) 05:52:54.53",
"userid":"xxxxxxxx",
"text": "○○について語りましょう"
},
{
"threadid": 2,
"name": "名無しさん",
"time": "2012/02/17(金) 05:52:57.32",
"userid":"yyyyyyyy",
"text": "この前・・"
},
:
:
:
]
}

------------------------------------------------------------

納品時にこちらで複数パターンのページで情報を収集できるかチェックします。



■必須スキル
- linux(linux上で動かします)
- python3(3.6でお願いします)
- beautifulsoup4(別ツールに組み込むため、scrapyは使用しないでください)

■予算
3~5000円程度
少額での依頼になります。

■納品
納品は9月中旬を希望ですが、伸ばすこともできますので
ご相談ください。

■その他
現在様々なツールを開発しており、パーツを色々と準備しています。
人手が足りないため、今後も類似の案件を依頼する可能性がありますので
よろしくお願いします。(特にpython,javascript関係)


ジャンル
その他
作業範囲
  • バックエンド開発
用意してあるもの
設定なし
参考URL
設定なし
希望開発言語
Python
フレームワーク
分からないので、相談して決めさせていただければと思います。
開発の継続性
この開発の後も、継続的に依頼したいと思っております。
補足説明
設定なし