装修门户网站程序 cms,制作网页网站哪个好用,报考网页,淘宝上面如何做网站开题开了一整年是我没想到的#xff0c;还因此延毕了……我重新梳理一下我想做的研究以及相关痕迹。
我2023年3月找到的导师。起初我发现了在玩RTS游戏中会出现很多固定的套路#xff0c;选手为此要做大量的练习#xff0c;我就在想如何把这部分内容借助状态机这种流程给…开题开了一整年是我没想到的还因此延毕了……我重新梳理一下我想做的研究以及相关痕迹。
我2023年3月找到的导师。起初我发现了在玩RTS游戏中会出现很多固定的套路选手为此要做大量的练习我就在想如何把这部分内容借助状态机这种流程给固化下来于是老师为我指明了一个方向——人机结合我还和老师说了想做脑机接口和实现长生不老老师没笑话我而是认真的给我说了她的team没有做脑机的东西人机结合的想法是很有价值和意义的。
老师在2023年7月、9月都很关切我主动来问我研究进展。但是在老师的平台上难以开发界面程序兵棋平台只适合做机器学习……加上对老师是害怕的态度于是卡了很久又没敢说导致2024年3月交上开题报告时一塌糊涂线上组会参加后我又查了RLHF相关论文发现在多智能体上采用没人做出来都是在大预言模型上进行的。
人机结合的题目去掉了RLHF的版本在2024年6月着急有点逼着老师给我过了但是评委老师那里没给过老师对我的态度也下降了不少生气也带上了不少失望在里面像是我给老师画饼但没兑现相关的模块开发。这个失败还有别的原因人机结合的成效十分难以评价我又是非脱产没进组没有数据可以用来证明和评估。
后来让我自己找题目我还是想做我的“机械飞升”加上ai转绘已经十分发展我想融入扩散算法来实现“人的操作的风格提取”以达到做出“ai替身”的目标。
我就不敢做别的内容仍然在兵棋里找直到后来老师对我发火不让我在兵棋上做了我才又找的别的。最后找到了开源的microRTS平台IEEE每年的只能游戏比赛上都有它于是我开始配置、找python的转接项目……最后终于搞通了然后想出了“策略提取”这个题目——因为策略风格不好衡量而策略可以作为行为序列来进行定义。再然后想到了对“包围、穿插”等行为的识别和模仿于是定题目为“策略提取的智能体融合与构建”这样就能像那些ai出图网站上对不同图片风格进行“杂交”了但是在老师那里评价到一是工程量太大了肯定做不了二是不好作为研究一点突破也能毕业但再大的工程也不能毕业于是我开始删减找题目。
再后来我找到了其中的一点——策略识别上然后开始搞星际2的数据集和相关论文。经过后来老师的提点我找到了“计划识别”这个方向可以作为辅助决策的用途。再经过讨论后我这个更像是“对手建模”在最后和老师讨论的时候老师问我到底想做什么我说了还是想做“AI替身”老师说你还是做你学姐的模仿学习吧把她出现的问题解决了解决好能出东西解决不了也可以分析问题也能毕业。
于是我开始想我的题目把我的“策略提取”融入到模仿学习智能体的优化上面……就是用对手建模的方法来优化智能体。卜了一盘说鬼神默佑而中——看看近在咫尺的ddl是否能过关吧……生活不像故事有个结局学业还在继续未完持续 注2022年12月到2023年9月底我的996实际上是早9晚10一周六天出差才基本结束2024又当项目负责人678三个月根本没自己的时间。
期间我也思考过存在的意义等问题写成了科幻小说在国科大的科普科幻大赛小小的拿了个奖当然自己的思考被别人认可的感觉还是很棒的
……看开点失败是成功之母失败代表着正在探索而不是原地踏步。