2019年1月31日木曜日
2019年1月29日火曜日
AlphaStar
AlphaStar
https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf
relational deep reinforcement learning
https://openreview.net/forum?id=HkxaFoC9KQ
deep LSTM core,
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.676.4320&rep=rep1&type=pdf
auto-regressive policy head
https://arxiv.org/abs/1708.04782
pointer network
https://papers.nips.cc/paper/5866-pointer-networks.pdf
centralised value baseline
https://www.cs.ox.ac.uk/people/shimon.whiteson/pubs/foersteraaai18.pdf
transformerHow AlphaStar is trainedAlphaStar’s behaviour is generated by a deep neural network that receives input data from the raw game interface (a list of units and their properties), and outputs a sequence of instructions that constitute an action within the game. More specifically, the neural network architecture applies a transformertorso to the units (similar to relational deep reinforcement learning), combined with a deep LSTM core, an auto-regressive policy head with a pointer network, and a centralised value baseline. We believe that this advanced model will help with many other challenges in machine learning research that involve long-term sequence modelling and large output spaces such as translation, language modelling and visual representations.AlphaStar also uses a novel multi-agent learning algorithm. The neural network was initially trained by supervised learning from anonymised human games released by Blizzard. This allowed AlphaStar to learn, by imitation, the basic micro and macro-strategies used by players on the StarCraft ladder. This initial agent defeated the built-in “Elite” level AI - around gold level for a human player - in 95% of games.
https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf
relational deep reinforcement learning
https://openreview.net/forum?id=HkxaFoC9KQ
deep LSTM core,
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.676.4320&rep=rep1&type=pdf
auto-regressive policy head
https://arxiv.org/abs/1708.04782
pointer network
https://papers.nips.cc/paper/5866-pointer-networks.pdf
centralised value baseline
https://www.cs.ox.ac.uk/people/shimon.whiteson/pubs/foersteraaai18.pdf
2019年1月24日木曜日
シリーズ 情報科学における確率モデル コロナ社
コロナ社からでるらしい。全13巻予定。
- 統計的パターン認識と判別分析 栗田多喜夫・日高章理 共著 2018年12月中旬刊
- ボルツマンマシン 恐神貴行 著 2019年1月下旬刊
- 捜索理論における確率モデル 宝崎隆祐・飯田耕司 共著 2019年2月下旬刊
- マルコフ決定過程-理論とアルゴリズム- 中出康一 著 2019年3月上旬刊
- エントロピーの幾何学 田中 勝 著 2019年4月上旬刊
- システム信頼性の数理 大鑄史男 著
- マルコフ連鎖と計算アルゴリズム 岡村寛之 著
- 確率モデルによる性能評価 笠原正治 著
- ソフトウェア信頼性のための統計モデリング 土肥 正・岡村寛之 共著
- ファジィ確率モデル 片桐英樹 著
- 確率システムにおける制御理論 向谷博明 著
- 高次元データの科学 酒井智弥 著
- リーマン後の金融工学 木島正明 著
この中では「エントロピーの幾何学」が楽しみ。
http://www.coronasha.co.jp/static/stochastic_models.html
2019年1月20日日曜日
ニッポン全国 和菓子の食べある記: 高島屋・和菓子バイヤーがこっそり教える郷土の和菓子500品
ニッポン全国 和菓子の食べある記: 高島屋・和菓子バイヤーがこっそり教える郷土の和菓子500品 単行本 – 2017/11/7
畑 主税 (著)
ニッポン全国 和菓子の食べある記: 高島屋・和菓子バイヤーがこっそり教える郷土の和菓子500品
著者ブログ
出版社サイト
2019年1月12日土曜日
2019年1月4日金曜日
2019年1月2日水曜日
Neural Ordinary Differential Equations
Neural Ordinary Differential Equations
Ricky T. Q. Chen*, Yulia Rubanova*, Jesse Bettencourt*, David Duvenaud
University of Toronto, Vector Institute
Toronto, Canada
{rtqichen, rubanova, jessebett, duvenaud}@cs.toronto.edu
Abstract
We introduce a new family of deep neural network models. Instead of specifying a
discrete sequence of hidden layers, we parameterize the derivative of the hidden
state using a neural network. The output of the network is computed using a blackbox differential equation solver. These continuous-depth models have constant
memory cost, adapt their evaluation strategy to each input, and can explicitly trade
numerical precision for speed. We demonstrate these properties in continuous-depth
residual networks and continuous-time latent variable models. We also construct
continuous normalizing flows, a generative model that can train by maximum
likelihood, without partitioning or ordering the data dimensions. For training, we
show how to scalably backpropagate through any ODE solver, without access to its
internal operations. This allows end-to-end training of ODEs within larger models.
2019年1月1日火曜日
ゲームで大学数学入門―スプラウトからオイラー・ゲッターまで―
ゲームで大学数学入門―スプラウトからオイラー・ゲッターまで―
2,300円 紹介するゲームはボードゲーム,カードゲーム,パズルゲームなどのローテク・ゲームが中心となっており,1940年代に登場したものから,21世紀に入ってから出現したものまで,幅広くとりあげられている。基本的に一つのゲームにつき,トポロジー,体,高次元空間,線形代数,射影平面,オイラー数,多様体,測度といった一つの数学のコンセプトを紹介していく。 |
https://www.kyoritsu-pub.co.jp/bookdetail/9784320113442
登録:
投稿 (Atom)
石田吉貞『隠者の文学』講談社学術文庫
FIRE系の動画や書籍を読んでいる。また、年齢を上になるにつれ、自分と社会の距離感なども気になる。本書は、以前から読んで気にいったいた中野孝二『清貧の思想』と同様の思想の書籍である。 石田吉貞『隠者の文学』講談社学術文庫 隠者の文学―苦悶する美 (講談社学術文庫) 隠者と隠者...
-
『46歳にてアフリカの小国ルワンダの中央銀行総裁に突然任命された日銀マンが悪銭苦闘しながら超赤字国家の経済を再建しつつ国民の生活環境を向上させた嘘のような実話。』 日頃、機械学習関連やSF系が多いので、このようなスケールの大きい仕事の本を読むことも面白い。1965年とかなり昔だ...
-
FIRE系の動画や書籍を読んでいる。また、年齢を上になるにつれ、自分と社会の距離感なども気になる。本書は、以前から読んで気にいったいた中野孝二『清貧の思想』と同様の思想の書籍である。 石田吉貞『隠者の文学』講談社学術文庫 隠者の文学―苦悶する美 (講談社学術文庫) 隠者と隠者...
-
ハインラインの『月は無慈悲の女王』を読んでいて、宗教、 思想系の本を調べた。 『月は無慈悲な女王』 月は無慈悲な夜の女王 『異星の客』 異星の客 (創元SF文庫) (創元推理文庫 618-3) 『異星の客』の思想性から高橋和巳『邪宗門』を思い出した。 邪宗門 ...