半年分のデータサイエンティストになるための学習プロセスの戦略とプラン
久々の休みで勉強中です。
この分野に従事してちょうど、一年ぐらい。
今の職場も半年たったので、半年後を目標にキャリアプランを考えて見ました。
まず、学習の視点から
データサイエンティストのスキルとしてよく取りげられる3つの視点で評価。
The Data Science Venn Diagram — Drew Conway
http://www.datascientist.or.jp/news/2014/pdf/1210.pdf
エンジニア力、サイエンス力、ビジネス力3つです。
エンジニア力
<現状分析>
ここは、どちらかというとビハインドが大きい。
プログラム経験は、大学以来だし、ディスレクシアの毛がある私は、
どちらかというとプログラミング向きじゃないかもしれない。
ただ、昔と違ってエディターが便利でハイライト機能や、
テキスト予測などを使ってやれるので注意すればある程度できると思う。
業務としてのプログラマーはちょっと厳しいし、戦略的に除外したので、
最低限理解できるレベルでやってきたいです。
SQLが一番、使っているかな~。業務の9割もSQL書いてBIツールの実装です。
(Bigqueryばっかり、jsonに苦戦中。RDBはほどほど理解あるが、リピートする構造に悩む)
<プラン>
業務的にはフロントに特化して行く予定。
hadoopとかサーバは必要最低限で!!
言語は、python、Rを主体にBIツール周りで使えそうなJavaScriptは時間が
余力があったらやりたい程度。
<現状態>
pythonはスタートアップが終わったので、Udemyで
データサイエンス講座を受講。実務でも自分用に作っているので、
ライブラリー入れながら実務でも使っていきたい。
Rは、見ながら叩ける程度。これは統計学習と合わせて勉強しようと検討中。
<目標>
機械学習を作るために使いたいな。
Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)
- 作者: Sebastian Raschka,株式会社クイープ,福島真太朗
- 出版社/メーカー: インプレス
- 発売日: 2016/06/30
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
この辺ぐらいまで行くのが目標。
サイエンス力
<現状分析>
統計は、大学で基礎はやったのですが、ブランクありすぎなので、再勉強。
習ったのは、重回帰分析とか実験計画法ぐらいまで。
実務で使ったことがあるのは、重回帰とアソシエーション分析かな~。
と、勉強し始めたが、さらにみどり本を買ったら
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者: 久保拓弥
- 出版社/メーカー: 岩波書店
- 発売日: 2012/05/19
- メディア: 単行本
- 購入: 16人 クリック: 163回
- この商品を含むブログ (26件) を見る
わかんない。無理。
と悲鳴をあげたので戻って戻って
<プラン>
からやっています。
次に赤本と青本を経て、みどり本まで行きたいです。
(赤本がどっかにあるはずなんだけどな~。)
<現状>
微分までやりました。なんとか2ヶ月で終わりにしたい。
<目標>
2ヶ月、数学、1ヶ月赤本、1ヶ月、青本、2ヶ月、みどり本、
MCMCまで行きたい。(マルコフ連鎖モンテカルロ法・・・)
最後に、
ビジネス力
<現状分析>
ここは圧倒的に優位だと思っている・・・。
感じです。コンサルタントしての経験や自営業者としての経験は、
多分データサイエンス業界にもまずいないキャリアだと思う・・・。
現場レベルの業務理解能力や特定業界の知見はほどほどかと。
小売、アパレル、不動産、サービス業界は強みあり。
メーカーなど大企業は少し苦手ですが、なんとかなるでしょう。
<プラン>
さておき、宅建の勉強中なので不動産業界をもう少し深めつつ、
せっかくゲーム会社にいるのでもう少し内部を理解しておきたい。
<現状態>
ゲーム内経済については、スペシャリストが後ろの席なので、
いろいろと吸収したいな~。
<目標>
最低限のビジネス書は読みつつつ、中小企業向けの
データサイエンスについては、考えておきたい。
一応、目標は書いたので半年きっちり勉強していきたい。
※バランススコアカードっぽくなったので他の視点も次回書いてみます。