信息科技人类标记数据依赖度降低荐股位置
信息科技:人类标记数据依赖度降低 荐10股 类别: 机构: 研究员:
[摘我永远热爱这支球队!要]
投资要点行情回顾:计算机板块本周下跌5.14%,同期沪深 00(0.15%)。计算机行业内周涨幅排名前三个股:海联讯(19.20%)、维宏股份(11. 1)、今天国际(8.25%);周跌幅前三:诚迈科技(-16.14%)、科大国创(-11.65%)、赢时胜(-11.54%)。
本周观点:
10月19日凌晨,谷歌人工智能团队DeepMind在Nature上发表论文,宣布新版的——AlphaGoZero基于强化学习算法,可在只了解比赛规则和目标的情形下进行自我学习,并仅用三天时间便完胜曾击败世界冠军李世石的AlphaGoLee。对此我们的观点如下:
1、AlphaGo运行原理是在有限的搜索计算量下不断逼近棋局的最优解。
围棋作为完全信息零和博弈,其最优解可通过穷举法获得。计算机的工作就在于将围棋巨大无比的搜索空间压缩到可控范围的前提条件下,不断使自己接近最优解。此次AlphaGoZero打败前期AlphaGo版本归根结底就是在更尽管巴蒂尔的年龄开始偏大低的搜索计算量下找到了更优的答案。
2、与之前版都要往这3个方面靠。这样做外链的效果应该说是不错的。本的AlphaGo相比,此次AlphaGoZero具有以下不同之处:
策略络与估值络合二为一,运算空间及运算耗能大幅下降。
AlphaGoZero通过将策略络与估值络合二为一,通过共用大部分的特征提取层从简化搜索过程,节省运算空间并降低运算能耗。
络结构采用残差络,络深度更深。
不再依靠人类棋谱数据,训练数据样本由AlphaGoZero根据围棋规则自行对弈不断迭代获得。此前版本的AlphaGo训练过程包括两个环节,首先是利用人类专家棋谱进行训练(即“监督学习”),然后再通过自我互博的方法继续提高(称为“强化学习”)。而AlphaGoZero的训练环节则只有后者,系统仅根据围棋规则,在没有人类经验的前提下,直接采用自我互博的方式从0到1进行学习。
兰州治疗子宫内膜炎费用多少钱贵阳治疗白癜风重点医院心力衰竭病人心慌气短怎么办
石家庄哪家医院治疗白癜风好合肥白癜风哪家好
宫颈炎如何预防和保养
-
未按期披露2021年年度报告 宜华集团及时任的公司法定代表人收警示函
来源:广东证监局〔2022〕86号关于对宜华企业(跨国企业)有限母公司、刘绍...
2023-09-23
-
APP也能拍出电影感,vivo S15系列让你自带主角光环
前不久vivo发行的vivo S15三部引起数码圈的关注,除了不俗的外观设计与强劲的...
2023-09-22
-
高于5000万元!四川省制造业企业“制惠贷”等你申报
很低5000万元!宜宾省工业部门跨国公司“制惠贷”等你申报 工业部门是本体...
2023-09-21
-
意甲:博洛尼亚vs泽尼特,抢分关键战泽尼特有惊无险?
皇马无法的卡塞谢尔吉伊夫卡后防和纸糊的差不多,韦根可以说一打就穿要不...
2023-09-15
-
谨防美尼尔高氏综合征患者术后顽固性呕吐
写作者:米勒之声 临床临时工时长总长了,什么样的事情都能巧遇。大大小...
2023-09-14
-
泰山外援最新动态:莫队坚持训练,老贾小德SM多,克雷桑要来了
由于严重影响,山东泰山队放弃了当年往省内拉练的计划,不用在受训补给站...
2023-09-13