虚無からはじめるデータ分析 ~接客からPython,そしてアジャイルへ~
4月からデータ分析のお仕事をする部署に移って
右も左も分からないながら勉強していった備忘録と
ジャンルごとに読んでみてよかったなぁという本を書いていきます。
そもそもなんでデータ分析してるの?
新卒で入社して最初に入った部署が
ざっくりいうとお客様対応をするところだったのですが
私が全く接客に向いていないため日々虚無になりつつあったので
2年目の4月から心機一転データ分析をする部署に異動しました。
(職場の人間関係とか業務内容はとっても良い環境でした! 念の為)
7月で新部署4ヶ月目に突入です。
なお、ド文系→途中から医療系(看護)に行ったので
入社してもプログラミングのプの字も知らない状態でした。
早く役に立てるように勉強がんばるぞ🔥
Pythonに触れよう
データ分析に関する知識が無だったので
とりあえずデータを扱うのに良いらしいPythonを学んでみよう
というところからスタートしました。
プログラミングの良いところはお金がかからないことと
やったらその結果がすぐにフィードバックされるので
モチベーションが維持しやすいことな気がします。
- 作者:株式会社ビープラウド,リブロワークス
- 発売日: 2018/06/22
- メディア: Kindle版
☆おすすめ☆
プログラミングの一切を解さない人間だったので
まずはとにかく優しい(易しい)本を求めていました。
その点でとても読みやすくて勉強になりました。
一番最初に実際に手を動かして
コードを書く体験をするにはうってつけだったと思います。
課金しました。
ChekiO
https://checkio.org/
ゲーム感覚でPythonを書く練習になりました。
面白いのですが、思っていたより難しかったです。
たぶん最初の島から出てなかった気がする…。
- 作者:Bill Lubanovic
- 発売日: 2015/12/01
- メディア: 単行本(ソフトカバー)
Pythonについて知ろうと思ってよみました。
本の厚さにビビりますが、一回通して読むと良い気がします。
Pythonを使ったデータの扱い方を学ぼう
Pythonが1mmくらいわかったので
Pythonで実際にデータ分析することについて
学んでみようじゃないかという気持ちになりました。
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者:Wes McKinney
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
データ操作について基本的なことが網羅されている気がします。
おすすめです。
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
- 作者:Jake VanderPlas
- 発売日: 2018/05/26
- メディア: 単行本(ソフトカバー)
こちらはライブラリの詳しいところまで説明した本な気がします。
個人的にはPandasとmatplotlibの説明が詳しいのが助かりました。
カラーページが多く、データの可視化について詳しいです。
特にBokehを扱っている書籍は手持ちだとこの本だけです。
Pythonデータ分析/機械学習のための基本コーディング! pandasライブラリ活用入門 impress top gearシリーズ
- 作者:Daniel Y. Chen,吉川 邦夫,福島 真太朗
- 発売日: 2019/02/22
- メディア: Kindle版
Pandasについて掘り下げて学ぶために読みました。
説明もわかりやすかったです。
前処理を学ぶために買いました。
Pythonに限らずRとSQLでのやりかたも載ってます。
実際に手を動かして学ぶ良い教材になりそうです。
最近見つけて冒頭チョットダケやりました。
こちらも100本系。
書籍の方がやはり解説は詳しい印象です。
データの可視化を学ぼう
データを整形したらそれを表現して
観察・コミュニケーションに使っていきたい。
それを効果的にするためには…? と思って読んだ本たち。
- 作者:コール・ヌッスバウマー・ナフリック
- 発売日: 2017/02/16
- メディア: 単行本
☆おすすめ☆
伝えたいことをシンプルに伝えるために
筆者が用いる12のデータ表現を学べる本。
シンプルだからこそメッセージが伝わりやすい。
データ可視化でモヤることが多い人はぜひ一度読んでみては。
Knowledge Is Beautiful: Impossible Ideas, Invisible Patterns, Hidden Connections--Visualized
- 作者:McCandless, David
- 発売日: 2014/10/21
- メディア: Flexibound
きれいなデータ表現が詰まった素敵ブック。
ほえ〜 こんなデータ表現があるのね、
という意味では他に類を見ない本かも。
Fundamentals of Data Visualization: A Primer on Making Informative and Compelling Figures
- 作者:Wilke, Claus O.
- 発売日: 2019/04/23
- メディア: ペーパーバック
なんと洋書。そしてまだ届いていない。
邦訳されるのを待っていたら何年かかるのか…
という憂いドリブンでポチりました。
海外発送なのでなかなか時間がかかります。
いい本だといいな。オライリーだからきっと大丈夫(?)
データサイエンスを学ぼう
1mmくらいデータ触れるようになったけど
じゃあそのデータ使ってなにができるの?
と思って読んだ本たち。
ゼロからはじめるデータサイエンス 第2版 ―Pythonで学ぶ基本と実践
- 作者:Joel Grus
- 発売日: 2020/05/01
- メディア: 単行本(ソフトカバー)
データサイエンスの技法の概観を学ぶのに
コンパクトにまとまっている本な印象です。
第1版を買ったわりとすぐあとに第2版が出てちょっと悔しい思いです。
- 作者:Steven S. Skiena
- 発売日: 2020/01/28
- メディア: 単行本(ソフトカバー)
こちらもデータサイエンス分野を概括的に紹介していますが
前述の本より読み物系な印象です。
カリキュラム形式で実際に手を動かしながら学びたい人におすすめ。
ちゃんとやろうとすると結構な時間がかかる気がします。私だけかな…?
機械学習を学ぼう
機械学習、実際に触ってみたい機運が高まってきたので
ちょっとだけ手を出してみています。
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
- 作者:Andreas C. Muller,Sarah Guido
- 発売日: 2017/05/25
- メディア: 単行本(ソフトカバー)
機械学習に触れてみたい!
という人にまずおすすめな1冊。
通読しきっていませんが
テキスト分析の章をめちゃ参照してます。
線形代数勉強しなきゃな…(遠い目)
- 作者:Chris Albon
- 発売日: 2018/12/15
- メディア: 単行本(ソフトカバー)
機械学習の具体的な操作で迷ったら
まず引いてみるとだいたいヒントが載っている本だと思われる。
機械学習やってみるぜ! という方は手元に置いとくとよさそう。
機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン)
- 作者:Alice Zheng,Amanda Casari
- 発売日: 2019/02/23
- メディア: 単行本(ソフトカバー)
機械学習の中でも特徴量エンジニアリングに特化した本。
スケーリングとテキストのところだけ拾い読みしました。
分析の基本的な考え方を学ぼう
データをちょっと触るようになった。
でもそもそも自分の役割である「データ分析」ってなんなのさ、
と思って読んだ本たち。
☆おすすめ☆
「分析」とはなんぞや
ということを考える上で非常に勉強になりました。
大きさをみる、分けて考える、比べて考える…
分析について考える時に立ち戻りたい一冊です。
良書です。
分析するといっても闇雲にやってはダメで、
イシューを見極めよということです。
言うは易し、行うはなかなか難し…
ここらへんの意識がアジャイルにつながります。
コンサルの仕事の仕方を学ぶには良い本だったと思います。
同時に自分のやる分析とコンサルの違いについても考えさせられました。
データ分析をビジネスに活かすことについて学ぼう
Pythonちょっと触れて分析について考えて、
じゃあ技術をビジネスに活かすってどうするの?
ということを考えるために読んだ本たち。
☆おすすめ☆
分析技術というより分析PJをいかに進めていくか
失敗談・経験談をもとに仕事のヒントが詰まっている気がします。
戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック
- 作者:Foster Provost,Tom Fawcett
- 発売日: 2014/07/19
- メディア: 単行本(ソフトカバー)
データサイエンスがビジネスのどういうシーンで用いられるのか?
技術とビジネスを結びつけて考えるのに勉強になる一冊だと思います。
まだ読み途中です。
こちらも機械学習がビジネスにどう活きるか?
ということを考えるのに学びの深い1冊だと思います。
- 作者:三木 雄信
- 発売日: 2017/08/18
- メディア: 単行本
難しい分析の技術を使わなくても
オーソドックスなやり方でビジネスに貢献できる
ということをすごく感じた本です。
カッコいい技術を学ぶとすぐそれで解決したいマインドになりがちですが
可能な限りシンプルなやり方でやる方がスマートだと
肝に命じておきたいです。
「下策をもって上首尾にいたったなら
上策からはじめるよりも数段勝る偉業ではないか!」
とはFate/Zeroイスカンダルの言。
こちらは技術というより組織(それも大規模な)において
データ分析チームをどう運営していくか、
という組織力学(?)を学べる1冊でした。
データ分析の良い指標について学ぼう
データ分析の結果を「なるほど、参考になりました。以上」
で終わらせないために、実際の判断や行動に結びつけるために
どういう指標について分析するのか悩む中で読みました。
行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する
- 作者:Stephen Wendel
- 発売日: 2020/06/11
- メディア: 単行本(ソフトカバー)
☆おすすめ☆
とっても面白いです。
内容はソフトウェア開発の文脈ですが
後半に出てくる「効果を測定する」の章は学びが大きいです。
Lean Analytics ―スタートアップのためのデータ解析と活用法 (THE LEAN SERIES)
- 作者:アリステア・クロール,ベンジャミン・ヨスコビッツ
- 発売日: 2015/01/24
- メディア: 単行本(ソフトカバー)
☆おすすめ☆
リーン = スタートアップ向けの本
という認識は合ってますが、
分析で迅速かつ的確にビジネスに貢献することについて
学びが大きく、とても面白い本だと感じました。
好きすぎて他のリーン本も3冊くらいポチりました。
良い指標設計の文脈でしばしば耳にするOKR。
その歴史的経緯とコンセプトを理解するのに良き本。
OKR(オーケーアール) シリコンバレー式で大胆な目標を達成する方法
- 作者:クリスティーナ・ウォドキー
- 発売日: 2018/03/15
- メディア: 単行本
OKRの実践についてストーリー仕立てに学べる本。
展開がちょっとハラハラする。
- 作者:天野 勝
- 発売日: 2019/02/20
- メディア: 単行本
実際に社内でOKRを展開するときのガイドブックのような本。
概念を学んで実際に使ってみる時におすすめかも。
因果推論を学ぼう
機械学習で予測や分類はできそう!
でも介入の効果検証はどうしたら…?
と思って読み始めた因果推論系の本。
因果推論についてわかりやすく書かれた素晴らしい本!
…っていうのは私が津川先生のファンだからという点もあり、
そしてなにげに読み切れていない…。
でも因果推論とは? という最初の一歩目におすすめしておきます。
因果推論をするための手法について
主だったところを複数の専門家の寄稿というかたちで
ざっと概観が掴める本な気がします。
こっちは津川先生のパートもちゃんと読みました!
(理解できたとは言っていない)
カスタマーサクセスを学ぼう
SaaS企業にいる宿命として
お客様の心を掴み続けるという使命があります。
この領域でやっていくぜ! という気持ちで読んだ本たち。
カスタマーサクセス――サブスクリプション時代に求められる「顧客の成功」10の原則
- 作者:ニック・メータ,ダン・スタインマン,リンカーン・マーフィー
- 発売日: 2018/06/06
- メディア: Kindle版
☆超おすすめ☆
何らかのかたちでカスタマーサクセスに関わる人、
特に分析の力で貢献したい人にはぜひともおすすめな本。
というかマスト! たぶん!
カスタマーサクセスはデータ分析をもとにした予測の分野です。
THE MODEL(MarkeZine BOOKS) マーケティング・インサイドセールス・営業・カスタマーサクセスの共業プロセス
- 作者:福田 康隆
- 発売日: 2019/01/30
- メディア: 単行本(ソフトカバー)
セールスフォースのカスタマーサクセスを学べる本。
他社でカスタマーサクセスしている友達に激推しされた一冊。
アジャイルとスクラムを学ぼう
データ分析をいい感じにやっていきたい!
という思いと裏腹に「いい結果(わかりやすい結果)が出るまで分析する」
というスタンスでは泥沼にハマることが多いという
苦い失敗経験を学生時代にいくつも積んできた…。
手戻りや不毛な泥沼をなるだけ避ける方法として
アジャイル/スクラムを勉強し始めた時に読んだ本たち。
みんなでアジャイル ―変化に対応できる顧客中心組織のつくりかた
- 作者:Matt LeMay
- 発売日: 2020/03/19
- メディア: 単行本(ソフトカバー)
☆おすすめ☆
ソフトウェア開発以外の文脈に適用できる
数少ないアジャイル本(だと思う)。
3つの原則がシンプルにまとまっており、
さっと読めるのでチームで認識共有するのにも向いてそう。
顧客から出発するんや…! という気持ちになる。
☆おすすめ☆
漫画のストーリー形式でスクラムを学べる。
こちらもさっと読めて各イベントもわかりやすく紹介されているので
スクラムなんぞや、という人にとてもおすすめな気がします。
こちらは熱いストーリー仕立て。
展開がシリアスでちょっとヒヤヒヤしながら読んだ覚えがあります。
アジャイルにやる、って言った時に
じゃあどうやって見積もりや計画づくりをするの?
ってなって読み始めた本。
ソフトウェア開発の文脈じゃなくてもとても勉強になる。
コーディング周りの基礎知識を学ぼう
ちょっとずつPython書いてはみたけど
あまりに基礎的な知識がない…と絶望して
基礎の基礎っぽいところから勉強するために読んだ本たち。
エディタ、とっても大事だなとじわじわ痛感したので購入しました。
なかなか周りに教えてくれる人と普段接しないので
基礎から説明してくれる本は有用。
現行、PythonはVSCodeで書いて
右側に対話的環境と変数窓を表示するのが一番捗る。
コードもきれいに保ちやすいしおすすめです。
- 作者:大澤 文孝
- 発売日: 2019/08/23
- メディア: 単行本
これでGitが自在に使いこなせる…!
というスコープではないですが、
とりあえずGitの概念を理解して
Git用語がわかるようになる!
というレベルが達成できる本だと思われます。
とても読みやすかったです。
リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice)
- 作者:Dustin Boswell,Trevor Foucher
- 発売日: 2012/06/23
- メディア: 単行本(ソフトカバー)
良いコードってなんでしょうね。
私は自分の書いたコードをあとから読んで
「こいつ…いったいなにがしたいんだってばよ…」
ってなることがしきりにあるので読みました。
これを読んでチョットはマシになったと思います。
ちゃんとした関数名とコメントを!!
おまけ
分析に直接関係しないけど、
私にとって意義深かった本。
顧客対応で虚無を感じていた頃に
先輩におすすめしてもらって読んだ本。
こりゃこのままじゃアカンわ〜〜
と思って社内ジョブチェンジするきっかけになりました。
マジ感謝。
終わりに
いろいろ本を読んでみて、
全ての内容がきれいに頭に入っている
なんてこと全然無いわけなんですが
少なくてもこの内容だったら関連する話があの本にあったはず、とか
この問題はたぶんこの分野のあの技術が適用できる気がする…とか
そういうインデックスづくりとして本は良いものだなと思います。
まだまだ勉強も実践も足りません。地道にやっていこう。