2019年1月31日木曜日
2019年1月29日火曜日
AlphaStar
AlphaStar
https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf
relational deep reinforcement learning
https://openreview.net/forum?id=HkxaFoC9KQ
deep LSTM core,
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.676.4320&rep=rep1&type=pdf
auto-regressive policy head
https://arxiv.org/abs/1708.04782
pointer network
https://papers.nips.cc/paper/5866-pointer-networks.pdf
centralised value baseline
https://www.cs.ox.ac.uk/people/shimon.whiteson/pubs/foersteraaai18.pdf
transformerHow AlphaStar is trainedAlphaStar’s behaviour is generated by a deep neural network that receives input data from the raw game interface (a list of units and their properties), and outputs a sequence of instructions that constitute an action within the game. More specifically, the neural network architecture applies a transformertorso to the units (similar to relational deep reinforcement learning), combined with a deep LSTM core, an auto-regressive policy head with a pointer network, and a centralised value baseline. We believe that this advanced model will help with many other challenges in machine learning research that involve long-term sequence modelling and large output spaces such as translation, language modelling and visual representations.AlphaStar also uses a novel multi-agent learning algorithm. The neural network was initially trained by supervised learning from anonymised human games released by Blizzard. This allowed AlphaStar to learn, by imitation, the basic micro and macro-strategies used by players on the StarCraft ladder. This initial agent defeated the built-in “Elite” level AI - around gold level for a human player - in 95% of games.
https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf
relational deep reinforcement learning
https://openreview.net/forum?id=HkxaFoC9KQ
deep LSTM core,
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.676.4320&rep=rep1&type=pdf
auto-regressive policy head
https://arxiv.org/abs/1708.04782
pointer network
https://papers.nips.cc/paper/5866-pointer-networks.pdf
centralised value baseline
https://www.cs.ox.ac.uk/people/shimon.whiteson/pubs/foersteraaai18.pdf
2019年1月24日木曜日
シリーズ 情報科学における確率モデル コロナ社
コロナ社からでるらしい。全13巻予定。
- 統計的パターン認識と判別分析 栗田多喜夫・日高章理 共著 2018年12月中旬刊
- ボルツマンマシン 恐神貴行 著 2019年1月下旬刊
- 捜索理論における確率モデル 宝崎隆祐・飯田耕司 共著 2019年2月下旬刊
- マルコフ決定過程-理論とアルゴリズム- 中出康一 著 2019年3月上旬刊
- エントロピーの幾何学 田中 勝 著 2019年4月上旬刊
- システム信頼性の数理 大鑄史男 著
- マルコフ連鎖と計算アルゴリズム 岡村寛之 著
- 確率モデルによる性能評価 笠原正治 著
- ソフトウェア信頼性のための統計モデリング 土肥 正・岡村寛之 共著
- ファジィ確率モデル 片桐英樹 著
- 確率システムにおける制御理論 向谷博明 著
- 高次元データの科学 酒井智弥 著
- リーマン後の金融工学 木島正明 著
この中では「エントロピーの幾何学」が楽しみ。
http://www.coronasha.co.jp/static/stochastic_models.html
2019年1月20日日曜日
ニッポン全国 和菓子の食べある記: 高島屋・和菓子バイヤーがこっそり教える郷土の和菓子500品
ニッポン全国 和菓子の食べある記: 高島屋・和菓子バイヤーがこっそり教える郷土の和菓子500品 単行本 – 2017/11/7
畑 主税 (著)

ニッポン全国 和菓子の食べある記: 高島屋・和菓子バイヤーがこっそり教える郷土の和菓子500品
著者ブログ
出版社サイト
2019年1月12日土曜日
2019年1月4日金曜日
2019年1月2日水曜日
Neural Ordinary Differential Equations
Neural Ordinary Differential Equations
Ricky T. Q. Chen*, Yulia Rubanova*, Jesse Bettencourt*, David Duvenaud
University of Toronto, Vector Institute
Toronto, Canada
{rtqichen, rubanova, jessebett, duvenaud}@cs.toronto.edu
Abstract
We introduce a new family of deep neural network models. Instead of specifying a
discrete sequence of hidden layers, we parameterize the derivative of the hidden
state using a neural network. The output of the network is computed using a blackbox differential equation solver. These continuous-depth models have constant
memory cost, adapt their evaluation strategy to each input, and can explicitly trade
numerical precision for speed. We demonstrate these properties in continuous-depth
residual networks and continuous-time latent variable models. We also construct
continuous normalizing flows, a generative model that can train by maximum
likelihood, without partitioning or ordering the data dimensions. For training, we
show how to scalably backpropagate through any ODE solver, without access to its
internal operations. This allows end-to-end training of ODEs within larger models.
2019年1月1日火曜日
ゲームで大学数学入門―スプラウトからオイラー・ゲッターまで―
ゲームで大学数学入門―スプラウトからオイラー・ゲッターまで―
2,300円 紹介するゲームはボードゲーム,カードゲーム,パズルゲームなどのローテク・ゲームが中心となっており,1940年代に登場したものから,21世紀に入ってから出現したものまで,幅広くとりあげられている。基本的に一つのゲームにつき,トポロジー,体,高次元空間,線形代数,射影平面,オイラー数,多様体,測度といった一つの数学のコンセプトを紹介していく。 |
https://www.kyoritsu-pub.co.jp/bookdetail/9784320113442
登録:
投稿 (Atom)
バージニア・ウルフ
バージニア・ウルフ(Virginia Woolf, 1882年1月25日 - 1941年3月28日)は、イギリスの小説家、随筆家、批評家であり、20世紀モダニズム文学の重要な作家の一人です。彼女は意識の流れの技法や詩的な散文を駆使し、文学に革新をもたらしました。また、フェミニズ...

-
An MIT Press book Ian Goodfellow, Yoshua Bengio and Aaron Courville http://www.deeplearningbook.org/ 深層学習
-
MLPシリーズを買い込んでいるが積ん読になってきている。モチベーション維持のため少し紹介をまとめてみる。 『スパース性に基づく機械学習 MLP機械学習プロフェッショナルシリーズ』 冨岡亮太著 講談社 定価2800円(税別) ISBN-13: 978-4061529106 ...
-
huluで又吉直樹の太宰治に関する番組を見た。 その中に「乞食学生」という作品が紹介されており、青空文庫で確認すると ガロアやアーベルの名前が出てきた。 青空文庫 乞食学生 http://www.aozora.gr.jp/cards/000035/files/285_15...