2019年1月29日火曜日

AlphaStar

AlphaStar



How AlphaStar is trained
AlphaStar’s behaviour is generated by a deep neural network that receives input data from the raw game interface (a list of units and their properties), and outputs a sequence of instructions that constitute an action within the game. More specifically, the neural network architecture applies a transformertorso to the units (similar to relational deep reinforcement learning), combined with a deep LSTM core, an auto-regressive policy head with a pointer network, and a centralised value baseline. We believe that this advanced model will help with many other challenges in machine learning research that involve long-term sequence modelling and large output spaces such as translation, language modelling and visual representations.
AlphaStar also uses a novel multi-agent learning algorithm. The neural network was initially trained by supervised learning from anonymised human games released by Blizzard. This allowed AlphaStar to learn, by imitation, the basic micro and macro-strategies used by players on the StarCraft ladder. This initial agent defeated the built-in “Elite” level AI - around gold level for a human player - in 95% of games.
transformer
https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf

 relational deep reinforcement learning
https://openreview.net/forum?id=HkxaFoC9KQ

deep LSTM core,
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.676.4320&rep=rep1&type=pdf

auto-regressive policy head
https://arxiv.org/abs/1708.04782

pointer network
https://papers.nips.cc/paper/5866-pointer-networks.pdf

 centralised value baseline
https://www.cs.ox.ac.uk/people/shimon.whiteson/pubs/foersteraaai18.pdf

2019年1月24日木曜日

動的ボルツマンマシン 恐神貴行

https://www.criprof.com/magazine/2017/04/24/post-4017/
ボルツマンマシン (シリーズ 情報科学における確率モデル 2)

シリーズ 情報科学における確率モデル コロナ社


コロナ社からでるらしい。全13巻予定。
  1. 統計的パターン認識と判別分析
  2. 栗田多喜夫・日高章理 共著 2018年12月中旬刊
  3. ボルツマンマシン
  4. 恐神貴行 著 2019年1月下旬刊
  5. 捜索理論における確率モデル
  6. 宝崎隆祐・飯田耕司 共著 2019年2月下旬刊
  7. マルコフ決定過程-理論とアルゴリズム-
  8. 中出康一 著 2019年3月上旬刊
  9. エントロピーの幾何学
  10. 田中 勝 著 2019年4月上旬刊
以下続刊
  • システム信頼性の数理
  • 大鑄史男 著
  • マルコフ連鎖と計算アルゴリズム
  • 岡村寛之 著
  • 確率モデルによる性能評価
  • 笠原正治 著
  • ソフトウェア信頼性のための統計モデリング
  • 土肥 正・岡村寛之 共著
  • ファジィ確率モデル
  • 片桐英樹 著
  • 確率システムにおける制御理論
  • 向谷博明 著
  • 高次元データの科学
  • 酒井智弥 著
  • リーマン後の金融工学
  • 木島正明 著

この中では「エントロピーの幾何学」が楽しみ。
http://www.coronasha.co.jp/static/stochastic_models.html

2019年1月2日水曜日

NIPS 2018最優秀賞論文】トロント大学発 : 中間層を微分可能な連続空間で連結させる、まったく新しいNeural Networkモデル

http://ainow.ai/2018/12/25/159218/

統数チャンネル

https://ch.nicovideo.jp/tousuuken

機械学習 論文キュレーションツール curation tool

arxiv sanity preserver
http://www.arxiv-sanity.com/toptwtr

deeplearn.org
https://deeplearn.org/

Neural Ordinary Differential Equations

Neural Ordinary Differential Equations

Ricky T. Q. Chen*, Yulia Rubanova*, Jesse Bettencourt*, David Duvenaud University of Toronto, Vector Institute Toronto, Canada {rtqichen, rubanova, jessebett, duvenaud}@cs.toronto.edu 

Abstract 
We introduce a new family of deep neural network models. Instead of specifying a discrete sequence of hidden layers, we parameterize the derivative of the hidden state using a neural network. The output of the network is computed using a blackbox differential equation solver. These continuous-depth models have constant memory cost, adapt their evaluation strategy to each input, and can explicitly trade numerical precision for speed. We demonstrate these properties in continuous-depth residual networks and continuous-time latent variable models. We also construct continuous normalizing flows, a generative model that can train by maximum likelihood, without partitioning or ordering the data dimensions. For training, we show how to scalably backpropagate through any ODE solver, without access to its internal operations. This allows end-to-end training of ODEs within larger models. 

https://arxiv.org/pdf/1806.07366.pdf

どんな外国語でも半年でマスターしてしまう方法 | クリス・ロンズデール | TEDxLingnanUniversity


Rethinking Statistical Learning Theory: Learning Using Statistical Invariants Vladimir Vapnik


2019年1月1日火曜日

ゲームで大学数学入門―スプラウトからオイラー・ゲッターまで―

ゲームで大学数学入門―スプラウトからオイラー・ゲッターまで― 


2,300円

紹介するゲームはボードゲーム,カードゲーム,パズルゲームなどのローテク・ゲームが中心となっており,1940年代に登場したものから,21世紀に入ってから出現したものまで,幅広くとりあげられている。基本的に一つのゲームにつき,トポロジー,体,高次元空間,線形代数,射影平面,オイラー数,多様体,測度といった一つの数学のコンセプトを紹介していく。

https://www.kyoritsu-pub.co.jp/bookdetail/9784320113442




石田吉貞『隠者の文学』講談社学術文庫

 FIRE系の動画や書籍を読んでいる。また、年齢を上になるにつれ、自分と社会の距離感なども気になる。本書は、以前から読んで気にいったいた中野孝二『清貧の思想』と同様の思想の書籍である。 石田吉貞『隠者の文学』講談社学術文庫 隠者の文学―苦悶する美 (講談社学術文庫) 隠者と隠者...