腾讯研发全新框架:用AI打,让DeepSeek学会战略性思考
来源:24直播网
发布时间:2025-10-05 13:26:36

电竞资讯10月05日称 据 decoder 今天报道,腾讯研究人员最近用《王者荣耀》游戏作为训练平台,探索如何让 AI 在游戏中学会“战略性思考”,研究全新 TiG(Think in Games)框架,相关成果已发表于 Hugging Face 网站和 arXiv 平台。

研究团队指出,目前的 AI 模型存在明显的功能鸿沟,以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策,而语言模型虽然可以推理策略,但很难真正执行操作,为此他们研发了全新 TiG 框架,让模型在游戏中同步思考、行动。
团队选择以《王者荣耀》游戏作为训练范本,先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动,胜负回数均衡,AI 模型们必须要在每个定义好的场景下选择最佳策略,并解释其战略缘由。
具体来说,训练分为两个阶段,首先是在监督中学习,弄清楚这些策略的基本机制;随后通过奖励机制进行强化学习,如果行动正确能得 1 分,错误行动则得 0 分。
随后团队测试了多种语言模型,涵盖 Qwen2.5(7B、14B、32B)、Qwen3-14B 模型,并使用 DeepSeek-R1 大模型作为对照组;先从 DeepSeek-R1 提炼高质量训练数据,然后使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。
最终经过 TiG 框架训练的模型不仅能制定行动计划,还能解释原因,例如 AI 会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。
相关阅读
最新录像
01月13日NBA常规赛凯尔特人步行者全场录像
01-13
01月13日西甲第19轮塞维利亚vs塞尔塔全场录像
01-13
01月13日意甲第20轮尤文图斯vs克雷莫内塞全场录像
01-13
01月13日足总杯第3轮利物浦vs巴恩斯利全场录像
01-13
01月13日意甲第20轮热那亚vs卡利亚里全场录像
01-13
01月13日沙特联第15轮利雅得新月vs利雅得胜利全场录像
01-13
01月13日U23亚洲杯小组赛A组约旦U23vs吉尔吉斯斯坦U23全场录像
01-13
01月13日U23亚洲杯小组赛A组沙特U23vs越南U23全场录像
01-13
01月12日NBA常规赛火箭国王全场录像
01-12
01月12日意甲第20轮国际米兰vs那不勒斯全场录像
01-12
最新集锦
西甲马科斯阿隆索点射制胜塞尔塔客场10塞维利亚
01-13
意甲尤文50克雷莫内塞伊尔迪兹、戴维破门麦肯尼造乌龙+建功
01-13
足总杯利物浦41巴恩斯利进32强索博世界波+失误送礼维尔茨传射
01-13
意甲科隆博破门弗伦德鲁普建功热那亚30完胜卡利亚里
01-13
U23亚洲杯约旦10吉尔吉斯斯坦2胜1负小组第二携手越南U23出线
01-13
U23亚洲杯越南10沙特三战全胜小组第一晋级阮庭北破门制胜
01-13
火箭不敌西部倒一国王遭遇3连败!申京复出19+9阿门31+13+6
01-12
老鹰轻取勇士迎3连胜约翰逊23+11+6CJ首秀12分库里31+5
01-12
太阳击退奇才取3连胜布克三节打卡17+8萨尔19+15
01-12
残阵掘金力克雄鹿哈达威25分戈登23+6字母哥31+8+11
01-12
热词推荐
热门TAG
-
梅西
新加国联
珀斯光荣
布雷西亚青年队
离谱
少女
感谢
认可
激情
安慰
兴趣
克卢索夫
开门红
残暴
希腊
忘记
退票
坏
选用
收益
挪威U17
头难
锋芒
转折
北马里亚纳群岛U20
中央5台直播观看在线
卫视体育
国足直播
伊拉瓦拉老鹰VS墨尔本联直播
墨尔本城VS麦克阿瑟FC直播
频道直播
东南卫视节目表
中央四台在线直播高清
比利时甲级联赛
杜兰特集锦
吃鸡直播
中国男篮官网
cctv5正在直播乒乓球直播现场9号
桑普多利亚
斯诺克视频
尤文图斯直播免费观看
nba在线直播泡泡
857直播足球直播
雨燕直播体育免费直播在线观看
墨尔本城vs西部联直播
9球直播nba
883足球免费直播
红球直播nba
国际米兰对乌迪内斯直播
小九直播免费足球观看