タグ

EngineとFTPに関するtyosuke2011のブックマーク (1)

  • 45分で理解する webクローリング入門 斉藤之雄

    1. 45分で理解する WEBクローリング入門 オフィスサイトウ 斉藤之雄 www.fxfrog.com Twitter @yukio_saitoh 不許複製 2012/07/02 1 2. インデックス • Web基技術(リソース識別子、プロトコル) • リソース識別子の種類:URI, URL, URN • Webサーバと通信(実習:コマンドプロンプト使用) • HTMLドキュメントと Cookie • 検索エンジンの一般構造と利用動向 • 検索エンジンの対象(パブリック、プライベート) • 自動巡回、スパイダー(クローラ)、スクレーピングの制御 • クローラ情報の格納(リンク、ドキュメント) • プライベート検索エンジンの高精度化アプローチ(重み付け) • ※SEO 一般解釈と誤解釈 • まとめ • 参考文献一覧 ※SEO / Search Engine Optimization 検

    45分で理解する webクローリング入門 斉藤之雄
  • 1