Sparkによる実践データ解析―大規模データのための機械学習事例集 [単行本]
    • Sparkによる実践データ解析―大規模データのための機械学習事例集 [単行本]

    • ¥3,740113 ゴールドポイント(3%還元)
    • 在庫あり2026年1月18日日曜日までヨドバシエクストリームサービス便(無料)がお届け
100000009002499399

Sparkによる実践データ解析―大規模データのための機械学習事例集 [単行本]

価格:¥3,740(税込)
ゴールドポイント:113 ゴールドポイント(3%還元)(¥113相当)
お届け日:在庫あり今すぐのご注文で、2026年1月18日日曜日までヨドバシエクストリームサービス便(無料)がお届けします。届け先変更]詳しくはこちら
出版社:オライリージャパン
販売開始日: 2016/01/25
お取り扱い: のお取り扱い商品です。
ご確認事項:返品不可
店舗受け取りが可能です
マルチメディアAkibaマルチメディア梅田マルチメディア博多にて24時間営業時間外でもお受け取りいただけるようになりました

Sparkによる実践データ解析―大規模データのための機械学習事例集 の 商品概要

  • 要旨(「BOOK」データベースより)

    本書は、データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるSparkの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてSparkとScalaによるデータ処理の基本を学習し、Sparkを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「SparkRについて」と千葉立寛氏、小野寺民也氏による「SparkのJVM、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。
  • 目次(「BOOK」データベースより)

    ビッグデータの分析
    ScalaとSparkによるデータ分析の紹介
    音楽のレコメンドとAudioscrobblerデータセット
    決定木を使った森林被覆の予測
    K平均クラスタリングを使ったネットワークトラフィックにおける異常の検出
    潜在意味解析を使ったWikipediaの理解
    GraphXを使った共起ネットワークの分析
    ニューヨーク市のタクシーの移動データに対する地理空間及び履歴データ分析
    モンテカルロシミュレーションによる金融リスクの推定
    ゲノムデータの分析とBDGプロジェクト
    PySparkとThunderを使った神経画像データの分析
    Sparkの詳細
    MLlib Pipelines API
    SparkRについて
    SparkのJVM、OSレベルのチューニングによる高速化
  • 著者紹介(「BOOK著者紹介情報」より)(本データはこの書籍が刊行された当時に掲載されていたものです)

    ライザ,サンディ(ライザ,サンディ/Ryza,Sandy)
    Cloudera社のデータサイエンティストであり、Apache Sparkプロジェクトの活発なコントリビュータ。近年はClouderaでのApacheの開発をリードしており、Sparkによるさまざまな分析のユースケースにおける顧客の支援に時間を費やしている。Hadoop Project Management Committeeのメンバーでもある

    ラサーソン,ユーリ(ラサーソン,ユーリ/Laserson,Uri)
    Cloudera社のデータサイエンティスト。Clouderaでは、Hadoopエコシステム中のPythonにフォーカスしている。また、ライフサイエンスやヘルスケアを中心とする広範囲の問題に対して、Hadoopを導入する支援をしている。Uriは以前、MITでバイオメディカルエンジニアリングでPh.Dの取得を目指す傍ら、次世代診断の企業であるGood Start Geneticsを共同設立した

    オーエン,ショーン(オーエン,ショーン/Owen,Sean)
    Cloudera社でヨーロッパ、中東及びアフリカを担当するデータサイエンスのディレクター。2009年以来、Apacheの機械学習プロジェクトであるMahoutに対して大きく貢献しており、そのレコメンデーションフレームワークであるTasteを作成した。lambdaアーキテクチャの原理の上に構築された、Hadoop上の大規模リアルタイム学習のためのOryx(以前はMyrrixと呼ばれていた)プロジェクトを立ち上げた

    ウィルス,ジョシュ(ウィルス,ジョシュ/Wills,Josh)
    Cloudera社のデータサイエンスのシニアディレクターであり、幅広い業界に渡って、Hadoopベースのソリューションを開発するために顧客及びエンジニアと共に働いている。最適化されたMapReduce及びSparkのパイプラインをJavaで構築するためのApache Crunchプロジェクトの創始者であり、VPでもある。Clouderaに入社する以前は、Googleに勤めており、オークションのシステムの仕事をした後、Google+の分析インフラストラクチャの開発をリードしていた

    石川 有(イシカワ ユウ)
    株式会社リクルートテクノロジーズのアドバンスドテクノロジーラボに所属。株式会社ミクシィ在籍時にHadoopやHiveなどの分散処理システムに興味を持ち、分析基盤構築からアプリケーション設計、データサイエンス業務まで幅広くこなす。現在は、Apache Sparkの特に機械学習コンポーネントMLlibの開発に従事している
  • 出版社からのコメント

    ビッグデータを活用するためのデータサイエンスについてSparkを通して学ぶことができる書籍。
  • 内容紹介

    Sparkの基本を学んだ人が、さらにSparkでデータ分析をする方法を学ぶ本!
    実際の利用シーンを踏まえており、ビッグデータを活用するためのデータサイエンスについてSparkを通して学ぶことができます。分析手法の簡単な理論解説も併記してあり、前半の章は分析に詳しくエンジニアもハンズオンで学ぶことができます。またSparkをどう活かすかを学ぶだけでなく、実際のデータを利用する上でぶつかる問題をどうクリアするかまで解説されています。

Sparkによる実践データ解析―大規模データのための機械学習事例集 の商品スペック

商品仕様
出版社名:オライリー・ジャパン
著者名:サンディ ライザ(著)/ユーリ ラサーソン(著)/ショーン オーエン(著)/ジョシュ ウィルス(著)/石川 有(監訳)/玉川 竜司(訳)
発行年月日:2016/01/25
ISBN-10:487311750X
ISBN-13:9784873117508
判型:B5
発売社名:オーム社
対象:専門
発行形態:単行本
内容:電子通信
言語:日本語
ページ数:309ページ
縦:24cm
横:19cm
その他: 原書名: Advanced Analytics with Spark〈Ryza,Sandy;Laserson,Uri;Owen,Sean;Wills,Josh〉
他のオライリージャパンの書籍を探す

    オライリージャパン Sparkによる実践データ解析―大規模データのための機械学習事例集 [単行本] に関するレビューとQ&A

    商品に関するご意見やご感想、購入者への質問をお待ちしています!