URLからドメインのみを抽出するツールの作成(重複削除とドメイン取得可否チェックも!)の仕事・依頼・料金 | Webシステム開発・プログラミングの仕事 【クラウドソーシング ランサーズ】[ID:327257]

サイトマップ
For 発注者
この募集は終了しました。

URLからドメインのみを抽出するツールの作成(重複削除とドメイン取得可否チェックも!)の仕事

見積もり募集の結果

募集期間

7日間

提案数

15件

閲覧数

818回

実際の発注内容

依頼の予算
5,000 円 ~ 50,000
実際の支払金額
40,000 円 ~ 50,000
製作期間
8
実際の受注者
korupa03
korupa03

  • 希望時間単価 ---
  • 実績 1
  • 評価 5.0
  • プロジェクト完了率 ---
  • 機密保持
  • 本人確認
  • 電話

普段はWeb系の会社で第一線のプログラマーとして勤務しております。速度と品質と細かい気配りには自信があります。宜しくお願い致します。

スキル
Perl
Java
... もっと見る
発注者の声

見積もり募集の内容

提示した予算
5,000 円 ~ 50,000 円
依頼概要
URLからドメインだけを抽出するツールの作成依頼です。
(抽出後、重複するドメインは削除する!)

ここで言うドメインとは、
トップレベルドメインとセカンドレベルドメインです。

--------------

例えば、次のようなウィキペディアのURLがあったとすると、
→ http://ja.wikipedia.org/wiki/トップレベルドメイン一覧
このURLから「wikipedia.org」だけを抜き出したいのです。

他の例としては、参考画像1の353行目にある
http://afroeurope.blogspot.com/2009/05/german-street-renamed-after-poetess-may.html の場合、
このURLから「blogspot.com」の部分だけを抜き出したいです。

--------------

参考画像1のようなデータが数万行規模であります。また、そのようなファイルが多数あって、これらのURLからドメインのみを抽出させます。(作業するときは、ファイルひとつひとつを、順番に扱っていくカタチでかまいません!)

こういったデータをコピー&ペーストか、
テキストファイルのドラッグ・アンド・ドロップで読み込ませ、
Runボタンをポチっとおすと、ドメインだけを抽出して、さらに重複するものは削除してくれるようなツールを作成していただきたいです。

できれば、私の手持ちのドメイン内に設置できて、ブラウザ上で動くものを作っていただきたいですが、ご提案内容によっては、ローカルで動くものでもかまいません。

当方は、ツールの開発依頼は、普段、あまりしていませんので、相場がまったく分かりません!ですから、適正な見積り額をご提示していただけると助かります。

--------------

なお、参考画像1のデータは、ウェブサイトエクスプローラーというツールを使って、抽出したデータになります。
このソフトは、指定したURL内にある外部リンクを根こそぎ抽出するツールです。

また、ブラウザ上で動くツールというのは、次のようなものをイメージしています。
例)テキスト重複除去ツール → http://minutetool.com/tools/08/

--------------

作成していただきたいツールの概要は以上です。

説明不足で、イメージが掴みにくい点もあると思いますが、
そういった場合は、ご連絡いただければ対応いたします。

契約後、細かい点の打ち合わせにつきましても、その都度行っていきます。

まずは、どれくらいの見積もりで、納期はいつ頃になるかをご提案していただけると助かります。

よろしくお願いいたします。

株式会社アイデスク 猿木
依頼公開後の追記内容
追記です。
新たな見積りをお願いします。

本編の依頼にある機能にプラスして、
以下の2つの機能を追加した場合の見積りと、
作成日数のご提案をお願いします。

1)依頼では、テキストファイルのドラッグ&ドロップと書きましたが、
  ファイルが「csv形式」のものを読み込めるようにする。
  (※実際の対象ファイル例1、2を参照してください。)

2)取得できる場合は○(99%や1など)、そうでない場合は×(0%や0など)
  と結果をふるいにかけて、○のものを上の行にまとめる。

-----------------

※今回のツールの使用目的について
ウェブサイトエクスプローラーというツールを使って、海外サイトから
期限切れ中古ドメインを探す作業を効率化するツールの作成を目的としています。

ですから、大変、お手数をおかけしますが、再度
1と2を追加した場合の見積金額をご提案いただきたいのです。

なお、ウェブサイトエクスプローラーの出力結果である
CSVデータファイルの中身は、ドメインの重複削除前の
段階では、数万件あるのですが、重複削除をすると、
おおよそで、【数千件程度】になります。

これは、ウェブサイトエクスプローラーというツールが
ひとつのURL内にあるリンクをすべて抽出しようとするので、
同じドメインで違うページ!をたくさんピックアップするからです。

ですから、ドメイン取得可否チェックは【数千件】レベルと考えてください。

-----------------

設置するサーバーは、現在のところ、X2サーバーを予定しています。

※他にもレンタルサーバーを30社くらい借りていますので、
もし、安定性などを考えてオススメのサーバーがあれば、
ご提案いただけると助かります。(Xサーバー、さくら、ヘテムル等)

-----------------

ブラウザは、Chrome利用でお願いします。

なお、サーバー設置型で、ブラウザで使えるもの!と書きましたが、
それ以外のWindowsプログラム等でもご提案をしていただいてOKです。

では、お見積りを、よろしくお願いいたします。
追記2です。

参考資料として、添付したファイル!
「実際の対象ファイル例1.csv」
「実際の対象ファイル例2.csv」

の中にあるドメインで、メジャーなドメインがあります。
たとえば、wikipedia.org/amazon.com/twitter.com などです。

これらは、ウェブサイトエクスプローラー側で探索除外設定をする予定です。

また、ウェブサイトエクスプローラーの方で、ドメインが運用されているか
どうかをチェックする機能があるのですが、この機能をオンにすると、
計算時間が長くなるため、ウェブサイトエクスプローラーでは、ドメイン抽出
だけを行いたいのです。

そして、その後、今回作っていただくツールで、中古ドメインの取得可否を
チェックする流れにしたいです。

以上、追記が多くなりましたが、よろしくお願いいたします。
追記3です。

追記2までは、依頼タイトルに「ブラウザで使えるツール」と書いて
いましたが、それを削除しました!

当初はサーバー設置型でブラウザで使えると便利かと思っていたのですが、
多くのご提案をいただいた結果、そこにこだわる必要はないと判断しました。

お持ちの技術を活かして、安定してツールが動くことが大事なので、
サーバー設置型のPHPでも、javaでも、WindowsプログラムでもOKです。

では、よろしくお願いします。