実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門(講談社) [電子書籍]
    • 実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門(講談社) [電子書籍]

    • ¥2,860858 ゴールドポイント(30%還元)
    • すぐ読めます
100000086601622097

実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門(講談社) [電子書籍]

榊 剛史(著者)嶋田 和孝(著者)石野 亜耶(著者)吉田 光男(著者)小早川 健(著者)坂地 泰紀(著者)
価格:¥2,860(税込)
ゴールドポイント:858 ゴールドポイント(30%還元)(¥858相当)
フォーマット:
専用電子書籍リーダアプリ「Doly」が必要です。無料ダウンロード
出版社:講談社
公開日: 2022年05月27日
すぐ読めます。
お取り扱い: のお取り扱い商品です。
ご確認事項:電子書籍リーダーアプリ「Doly」専用コンテンツ
こちらの商品は電子書籍版です

実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門(講談社) の 商品概要

  • お待たせしました!
    大好評「実践Data Scienceシリーズ」から、ついにテキストアナリティクスが登場!
    基礎技術と分析アプローチがわかる入門書の決定版!
    ◆「spaCy+GiNZA」による一気通貫の分析がすぐに実践できる
    ◆観光/金融・経済/ソーシャルメディアの分析事例をていねいに解説
    ◆つまずきやすい「環境構築」もしっかりサポート

    【本書「巻頭言」より抜粋】
    アイディア次第でさまざまな分析が可能になるのがテキストアナリティクスの面白さです.その反面,多くの場合,簡単に結果が出るものではありません.諦めずに試行錯誤を続けることが重要です.基本的には多様な可能性に思いを巡らせることが有効です.それには経験の蓄積が活きてきますので,やればやるほど成果を出しやすくなります.自分で実際にデータを処理し,試行錯誤をしてみるのがテキストアナリティクスのスキルを向上させる近道です.その考えから,本書では試してみることを重要視しています.
    ――那須川哲哉(日本アイ・ビー・エム株式会社東京基礎研究所主席研究員)


    【主な内容】
    第I部 テキストアナリティクスの基礎
    第1章 テキストアナリティクスことはじめ
    第2章 プログラミングの補足知識
    第3章 環境構築
    第4章 基礎技術
     
    第II部 テキストアナリティクスの実践
    第5章 データ収集
    第6章 観光テキストの解析
    第7章 金融・経済テキストの解析
    第8章 ソーシャルメディアテキストの解析

    第III部 応用技術・発展的な内容
    第9章 実践的なテクニック
    第10章 深層学習技術
    第11章 環境構築の要らないテキストアナリティクス

    付録 本書で利用するPythonライブラリ

    【編著者紹介】
    榊 剛史
    株式会社ホットリンク 開発本部R&D 部長
    東京大学未来ビジョン研究センター 客員研究員
    中国・清華大学による世界的なAI研究者2000人に選出。2006年電力会社にて情報通信業務に従事した後、東京大学博士課程に入学。2013年松尾研究室にて博士号取得。2015年~株式会社ホットリンクに入社。

    【実践Data Scienceシリーズ】
    「基本をより実践的に!」を合言葉に、データサイエンスで用いられる各種手法の基本を、プログラミングの実装とともに解説していきます。
    はじめて学ぶ大学生、大学院生、ソフトウェアエンジニアに向けた注目の新シリーズです。
  • 目次

    第I部 テキストアナリティクスの基礎

    第1章 テキストアナリティクスことはじめ
     1.1 テキストアナリティクスとは?
     1.2 分析のためのアプローチ
     1.3 分析のための基盤技術
     1.4 まとめ:自然言語処理を学ぶために
    第2章プログラミングの補足知識
     2.1 文字コード
     2.2 ファイルの入出力
     2.3 正規表現
     正規表現のテスト・可視化方法
     2.4 内包表記
     2.5 まとめ:Pythonを使いこなすために
    第3章 環境構築
     3.1 Linux
     3.2 macOS
     3.3 Windows
     3.4 Pythonの仮想環境
     仮想環境の必要性
     3.5 まとめ:より快適な環境を構築するために
    第4章 基礎技術
     4.1 基礎的な解析
     spaCyの基本的な考え方
     4.2 文書の分類・クラスタリング
     4.3 可視化
     単語共起行列の計算
     4.4 まとめ:より深い分析を実現するために


    第II部 テキストアナリティクスの実践

    第5章 データ収集
     5.1 公開データ
     5.2 社内データ
     5.3 データ購入
     5.4 ウェブクローリング
    第6章 観光テキストの解析
     6.1 データの入手:観光テキスト解析に利用できるソーシャルメディアの例
     6.2 口コミを利用した観光地の分析
     6.3 口コミを利用したテーマパークの分析
     6.4 分析上の注意点
     6.5 研究の紹介
    第7章 金融・経済テキストの解析
     7.1 事前準備:金融・経済における極性分析
     7.2 データの入手:金融・経済テキストデータの入手
     7.3 基礎的な解析:基礎的なテキスト分析
     7.4 分析:有価証券報告書を用いた日経平均予想
     7.5 分析上の注意点
     7.6研究の紹介
    第8章 ソーシャルメディアテキストの解析
     8.1 Twitterデータによる世情分析
     8.2 2ちゃんねるデータによる世情分析
     8.3 大規模データ処理に対する工夫
     8.4 研究の紹介


    第III部 応用技術・発展的な内容

    第9章 実践的なテクニック
     9.1 単語処理に関するテクニック
     9.2 その他のツールの比較と利用方法
     9.3 まとめ
      根性マイニング
    第10章 深層学習技術
     10.1 単語分散表現
     10.2 文分散表現
     10.3 BERTをはじめとするTransformerモデルの利用
     10.4 まとめ
    第11章 環境構築の要らないテキストアナリティクス
     11.1 Google Colaboratoryを利用したテキストアナリティクス
     11.2 自然言語処理APIを利用したテキストアナリティクス
     11.3 まとめ


    付録 本書で利用するPythonライブラリ

実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門(講談社) の商品スペック

書店分類コード K800
Cコード 3004
出版社名 講談社
本文検索
他の講談社の電子書籍を探す
紙の本のISBN-13 9784065274101
ファイルサイズ 101.3MB
著者名 榊 剛史
嶋田 和孝
石野 亜耶
吉田 光男
小早川 健
坂地 泰紀
著述名 著者

    講談社 実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門(講談社) [電子書籍] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!