日本全国スピードお届け実施中！配達料金無料

JavascriptがOFFになっております。 ヨドバシ・ドット・コムはJavascriptをONにしてご利用ください。詳しくはこちらへ。

カテゴリから選ぶ

画像を投稿する

データを集める技術―最速で作るスクレイピング&クローラー [単行本]

佐々木拓郎(著)

価格：	￥2,640（税込）
ゴールドポイント：	80 ゴールドポイント（3％還元）（￥80相当）
フォーマット：	単行本￥2,640 80 ゴールドポイント（3％還元）電子書籍￥2,640 528 ゴールドポイント（20％還元）
お届け日：	在庫あり今すぐのご注文で、2026年3月5日木曜日までにヨドバシエクストリームサービス便（無料）がお届けします。［届け先変更］詳しくはこちら

出版社：	SBクリエイティブ
販売開始日：	2016/11/30
お取り扱い：	のお取り扱い商品です。
バリエーション：	データを集める技術―最速で作るスクレイピング&クローラー [単行本] 5件のバリエーションがあります
ご確認事項：	返品不可

カテゴリランキング

書籍
452491位

数量

ショッピングカートに入れる

お気に入りに登録する

在庫のある店舗0

店舗受け取りが可能です

マルチメディアAkiba、マルチメディア梅田、マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

データを集める技術―最速で作るスクレイピング&クローラーの商品概要

要旨（「BOOK」データベースより）
本書は、簡単なプログラムやツールを自作し、ＷｅｂサイトやＳＮＳからさまざまなデータを収集する方法を解説するものです。「プログラム」という言葉を目にするだけで尻込みする方もいらっしゃることでしょう。しかし、本書で紹介するプログラムやツールは、パソコンの基本的な使い方が理解できれば、誰でも作れる簡単なものです。作り方も手順を追って丁寧に解説していきますので、安心してお読みいただければと思います。
目次
Chapter1 スクレイピングとクローラーで効率的にデータを集めていく

1-1 データはWeb上に集まる
Web上に存在するデータの種類
本書が対象とするデータ

1-2 効率的にデータを収集するために行うこと
データ収集の3つのステップ

1-3 どうすれば自動化できるのか？
スクレイピングとクローラー
半自動化プログラムでできること
完全自動化プログラムでできること
本書の進め方

1-4 Webサイトからデータを集める際の注意事項
収集したデータの取り扱いと著作権
Webサイトのリソース圧迫と業務妨害
クローラーとAPI

Chapter2 Excelとブラウザを連携してWebページからデータを収集する

2-2 Excel VBAでWebからデータを収集する
Excelでのデータ収集テクニック
ExcelでVBAが使えるようにする設定
データを収集するためのプログラム

2-2 VBAでIEを操作する仕組み
宣言部分
VBAの関数の宣言
IEの操作

2-3 取得したHTMLから要素を抽出する仕組み
HTMLの構造
HTMLから要素を抜き出すプログラム

2-4 簡単な方法で要素を特定する
ChromeでXPathを抽出する方法
FirefoxでXPathの抽出する方法

2-5 WEBSERVICE関数とFILTERXML関数によるデータ収集
WEBSERVICE関数によるデータ収集
FILTERXML関数によるデータ収集

Chapter3 Googleスプレッドシートを利用して自動的にデータを収集する

3-1 GoogleスプレッドシートとGoogle Apps Scriptを準備する
Googleスプレッドシートとは
Google Apps Scriptとは
関数とクラス

3-2 ImportXML関数を使ってWebからデータを収集する
ImportXML関数の概要
株価データの取得方法
セルの値を利用した取得方法

3-3 Google Apps Scriptを利用してデータを収集する
Google Apps Scriptの使い方
Google Apps Scriptによるスクレイピング
Google Apps Scriptの実行

3-4 指定した時間に定期的にデータを収集する
Google Apps Scriptのトリガー
トリガーの設定方法

Chapter4 スクレイピング専用サービスを利用して手軽にWebからデータを収集する

4-1 import.ioを利用してWebからデータを収集する
import.ioのサービス概要
import.ioの利用方法

4-2 import.ioでスクレイピングを実行する
import.ioへのサインアップ
データの自動抽出
抽出したデータの取得方法
取得する要素の任意指定
APIを使ったデータ抽出

4-3 収集したデータをシート上に保存する
Googleスプレッドシートとの連携
Google Apps Scriptとの連携
Excelとの連携

Chapter5アプリケーションを利用してTwitterからデータを収集する

5-1 アプリを利用して収集した結果を通知する
通知を受け取るためのアプリケーション
IFTTTの概要
Slackの概要
myThingsの概要

5-2 IFTTTを使ってTwitter上でエゴサーチを行う
IFTTTの会員登録
モバイルアプリのインストール
Twitter検索のレシピ作成

5-3 Slackを利用して定期的にRSS情報を収集する
Slackの会員登録
RSSフィードの収集
モバイルアプリからの利用

5-4 myThingsを使ってTwitter上でエゴサーチを行う
会員登録とモバイルアプリのインストール
Twitter検索の組み合わせの作成

Chapter6 ターゲットを絞り込んで、さまざまなデータを自在に収集する

6-1 会社・商品に関する情報を収集する
特定のキーワードを収集する目的
収集・保存・通知方法

6-2 Webから特定の「キーワード」に関する情報を収集・蓄積する
Googleアラートの設定
IFTTTの設定
結果の確認

6-3 Twitterから特定の「キーワード」を含むツイートを収集・蓄積する
IFTTTの設定
結果の確認

6-4 App StoreからiOSアプリのランキングを収集する
ランキングのRSSフィード
ランキングの収集
結果を日付別シートに保存
指定した時間に毎日実行する

6-5 Google PlayからAndroidアプリのランキングを取得する
import.ioを使ったデータ収集
結果をGoogleスプレッドシートに保存
日本語ランキングの取得

6-6 Amazonのカスタマーレビューを収集する
import.ioを利用した収集方法
Googleスプレッドシート＋ImportXMLによる収集方法
Google Apps Scriptを利用した収集方法

6-7上場企業の時価総額を収集する
銘柄コード一覧の取得
株価に関する情報の収集
時系列で株価データを収集

6-8 Amazonのセール情報を取得する
Amazonのほしい物リスト
ほしい物リストから商品を取得（Excel版）
ほしい物リストから商品を取得する（Google Apps Script版）
Amazonの割引率が高い商品を探す
商品の割引率とポイント還元率の取得（Excel版）
商品の割引率とポイント還元率の取得（Google Apps Script版）

Chapter7 データを収集した後の見せ方と使い方のヒント

7-1 クローラー/スクレイピング開発と関連技術
認証が必要なページからのデータ収集
大規模
著者紹介（「BOOK著者紹介情報」より）（本データはこの書籍が刊行された当時に掲載されていたものです）
佐々木拓郎(ササキタクロウ)
大学卒業以来、一貫してＷｅｂ系のシステム開発に従事。企画から設計開発、運用まで全ての工程に関わる。またシリコンバレー勤務時代には、オープンソースのＲ＆Ｄや海外プロダクトの日本導入などに従事。最近の主な活動は、ＡＷＳ事業の推進とモバイルアプリ開発
内容紹介
インターネット・SNSから思い通りに情報を収集するための知識と実例をわかりやすく解説

ExcelやGoogleスプレッドーシート、APIなどを使ってクローラーをプログラミンし、簡単な操作で効率的にデータを集める手法を解説していきます。
企業情報、株価情報、Amazonの新刊情報、商品の口コミデータ、Googleの検索順位の履歴、Twitterから特定のキーワードの発見、iTunes/Google Playのアプリランキングなど、さまざまな役立つデータを収集していきます。
著者について
佐々木拓郎 (ササキタクロウ)
大学卒業以来、一貫してWeb系のシステム開発に従事。企画から設計開発、運用まで全ての工程に関わる。またシリコンバレー勤務時代には、オープンソースのＲ＆Ｄや海外プロダクトの日本導入などに従事。最近の主な活動は、AWS事業の推進とモバイルアプリ開発。どうすれば楽に過ごせるかを模索するために、忙しい日々を送っている。著書：『Rubyによるクローラー開発技法』『AmazonWebServicesパターン別構築・運用ガイド』『AmazonWebServicesクロウドネイティブ・アプリケーション開発技法』（SBクリエイティブ刊）

データを集める技術―最速で作るスクレイピング&クローラーの商品スペック

商品仕様	出版社名：SBクリエイティブ
	著者名：佐々木拓郎（著）
	発行年月日：2016/12/05
	ISBN-10：4797389028
	ISBN-13：9784797389029
	判型：A5
	対象：一般
	発行形態：単行本
	内容：電子通信
	言語：日本語
	ページ数：255ページ
	縦：21cm
他のSBクリエイティブの書籍を探す	書籍 SBクリエイティブ > 情報･通信･コンピュータ SBクリエイティブ > ネットワーク･通信 SBクリエイティブ > ネットワーク･通信 SBクリエイティブ

コミュニティ
3.0
レビューを投稿する

SBクリエイティブデータを集める技術―最速で作るスクレイピング&クローラー [単行本] に関するレビューとＱ＆Ａ

商品に関するご意見やご感想、購入者への質問をお待ちしています！

データを集める技術―最速で作るスクレイピング&クローラー [単行本]

カテゴリランキング

あわせて買いたい、よく一緒に購入されている商品

データを集める技術―最速で作るスクレイピング&クローラーの商品概要

要旨（「BOOK」データベースより）

目次

著者紹介（「BOOK著者紹介情報」より）（本データはこの書籍が刊行された当時に掲載されていたものです）

内容紹介

著者について

データを集める技術―最速で作るスクレイピング&クローラーの商品スペック

コミュニティ

カテゴリから選ぶ

メーカーから商品を選ぶ

イベントから商品を選ぶ

特集から商品を選ぶ

はじめてのお客様へ

アフターサービス

お買い物をもっと便利に

データを集める技術―最速で作るスクレイピング&クローラー [単行本]

カテゴリランキング

あわせて買いたい、よく一緒に購入されている商品

データを集める技術―最速で作るスクレイピング&クローラー の 商品概要

要旨（「BOOK」データベースより）

目次

著者紹介（「BOOK著者紹介情報」より）（本データはこの書籍が刊行された当時に掲載されていたものです）

内容紹介

著者について

データを集める技術―最速で作るスクレイピング&クローラー の商品スペック

コミュニティ

カテゴリから選ぶ

メーカーから商品を選ぶ

イベントから商品を選ぶ

特集から商品を選ぶ

はじめてのお客様へ

アフターサービス

お買い物をもっと便利に

データを集める技術―最速で作るスクレイピング&クローラーの商品概要

データを集める技術―最速で作るスクレイピング&クローラーの商品スペック