Review Life

​ 先说一下写这篇博客的背景吧,12.17,周三,全天在沙河值班,本来打算今天把所有基物的知识点过完,简单了解一下这学期学的内容(就是开始预习了),因为之前不怎么听基物课,电子信息工程这个专业和物理有关系,但不是和基础物理有关系。我们不去分析熵,焓这类的东西,至于波,我认为和数学更相关一点,不过在不同介质中的研究可能确实和基础物理有关系,总之就是我不太喜欢这门课。之前写的博客大多数都是英文,因为写的时候要遇到一些词汇,我不知道咋翻译也不想翻译,索性全用英文写了,而至于这种碎碎念的博客,用中文显然更简单。现在是19:41分,参考书今天就翻了几页,根本看不进去,大部分时间都用来和队员聊天和刷知乎了。倒也不是有什么负罪感,就是很好奇,为什么我会心甘情愿(或者换一个词语)地违背自己规划好的任务?

​ 之前,如果我规划在哪一天把论文读完,或者是哪一天完成电机的关节通讯什么的,我基本上都能完成任务,或者说,都能全身心的投入到任务中,不受外界干扰,而现在,我却不自觉地拿起手机,刷起知乎,今天看了一堆SLAM相关的水帖,我觉得知乎应该将回答发布的日期放在文章开头,要不然看了半天,发现作者有好多观点有明显的错误,最后发现这是2016年的文章(下图与文本无关,只是证明知乎的回答日期确实不在开头展现),时效性还是非常重要的,不过看一看前人的想法也能学习到很多知识。

review_life

​ 扯远了,我好奇的是,我是因为我喜欢一件事,所以我能够专心投入,还是因为我讨厌一件事,所以我不能专心投入,第二个观点是第一个的否命题。我想了想,可能都不是。基物实验报告,我就挺讨厌的,但还是能沉下心,一气呵成地写完。仔细想想,可能是我不擅长某件事,或者说我对这件事欠缺相应的知识,我就不能专心投入。虽然我讨厌基物实验报告,但是完成它不需要掌握什么知识,会写字会按计算器就行,往届还有实验报告参考(抄),没什么难度。而对于经验、知识欠缺,并且我还不喜欢的领域,我就不能专心投入。嗯,还得加上一个限定词:不喜欢。暑假搭建这个博客的时候,我也没有任何经验,知识,但还是坚持下来,上午申请好服务器,域名,一个晚上就搭建完了,当然搭个博客不是什么困难的事情,但我还是坚持下来。就算我在搭建的过程中遇到什么样的困难,我都想办法去解决,而不是放弃,有可能是我潜意识里知道一定能成功,因为已经有人做成了,也有可能是我非常喜欢,这东西控制不了变量,我也不知道是什么原因,总之我就是坚持下来了。做科研就不一样了,你不知道能不能行,甚至有时候潜意识会告诉你会失败,那种情况下还能坚持,真的就是靠信念了。我还没步入那种境界,因为还欠缺很多很多知识,至少我目前想的idea,都有人做过。其实我一点都不会因为有人实现了我的想法,而感到遗憾。高中的时候,我可能会有这种想法,想到一个绝妙的解题方法,我觉得大家都想不到,可是第二天有同学也想到了这个方法,当时的我可能会很沮丧。现在的我可能会觉得英雄所见略同,而且能够证明我的想法是对的,这真的很酷,随意想的一个idea,竟然真的是对的!或许我早出生几年是不是就发上顶会了哈哈哈。哦又扯远了😂,总之我觉得,我不能专心投入,就是因为我欠缺相应知识。但是学习这些知识,就需要我喜欢这门课,才会有足够的驱动力。然而,反过来也并不一定成立:即使我对一件事很感兴趣,但欠缺相应背景,也不一定就能专心投入——专心投入和感兴趣之间,并不是直接对等的因果关系。但是感兴趣和学习之间,我觉得对我来说,是因果关系。

​ 大学的优点在于,你可以选择学习你喜欢的课程,但是缺点就在于,你不能选择不学习你不喜欢的课程。我对学校当前的制度表示理解,但我确实不想学习一些课程,我认为当我完成期末考试的那一刻,可能我就不会再学习这门课程了,也就是说我花了一个学期学习一门我终生用不上的课程,除了浪费时间,没有任何意义。并且如果我要保研,我就要在这些课程上花费不少的时间和精力。在大一上的期末,我就过的很煎熬,我一点都不想刷题,真的是一点点都做不进去题,并不是我不会那些基本的知识,而是我做题的时候总是在反问自己:你来大学是为了什么?你是为了刷题保研吗?我的内心告诉我,大学不能这么度过,而是要去尝试自己喜欢的东西,做自己感兴趣的事,但大一面临专业分流的压力,不得不在煎熬中刷题复习,最后两门数学课都考了90。对我来说,我觉得90分还不错,但对保研来说,还差的远呢!因为北航给分其实挺松,有很多同学都能够达到90+,并且我其他的科目,比如思法,习概都上不了90,导致最后的均分绩点并不高,好像只有87/88?记不清了,总之大一上完的那个暑假, 大类排名300多,分流后专业排名80,保研确实很困难,但理论上仍然有希望,如果我后面的几个学期都猛猛卷。但难度还是很大,因为大家都知道该如何应付大学的考试了,差距就很难拉开,也就是从那个时候,我决定放弃保研,做一些喜欢的事情,当然在导员面前我还说保研是底线哈哈哈哈,虽然导员很不屑的说你这绩点还想保研?记得高考完,我曾和数学老师交流过选哪个大学,一个大学承诺给我保研,一个大学适合我的分数,但是很卷。老师说:“你最后肯定是要读研的,不要为了保研去那里,去北京你的机会更多”。当时的我觉得,研究生一定是一个很厉害的学位,一定能做出很多创新的成果。但上了大学后,我发现,其实研究生只是本科生长大了,那个人本科是什么样,大概率研究生也是什么样,也许会学到一些知识,但这些知识你让大一大二的本科生去学,也能学会。就好比大学课本的知识高中生也能学会,壁垒没有那么那么强。只是因为当今学历贬值,企业发现用本科生的工资也能招来研究生,索性直接招研究生了,因为客观上比应届本科生大几岁的研究生能力更强。但是就我观察到的情况,研究生好像并不太喜欢自己研究的领域,好像只是想赶紧毕业,有个研究生文凭,更好找工作。这和我高中时候对研究生的观点截然不同,不是因为喜欢这个领域,从而读研,而是想要有一个更高的学历,找工作的时候有一个更好的背景。感觉像十几年前日本的学历贬值,有时间真得好好分析下“日本失去的三十年”,感觉是前瞻服哈哈哈。

​ 这学期初,我就决定了做些喜欢的事,画了第一张PCB板,做了第一个自制的USB2.0拓展坞,加入了机器人队,加入了罗老师的课题组,当时的我觉得这学期应该会完成很多很多任务吧,现在回看,感觉自己并没做什么特别特别fantastic的任务。10月一整个月都在熟悉课题组和机器人队,属于是一个入门的状态,每周读一篇论文,组会上分享一下,每周值班的时候摸摸鱼,听一下机器学习的课程(没错我就是在9月创建的机器学习博客,10月写了第一节课的笔记和代码,当然这个代码是把开源的代码做了些自己的改动,加了些注释)。在10月末,我读了MIT的微动放大论文,这真的是一篇非常非常非常优秀的论文,提出的idea是我从未想过的一种方法,在当时也一定是非常新颖的想法,但也不一定,有可能论文中的想法以前有人做过只是应用于其他领域,但这个idea给我的第一感觉就是非常的 genius,本来打算好好分析下论文,写一个博客,可惜后面没有时间,只能等到寒假了,寒假一定要把这个任务放到第一位!这也是我第一个复现成功的论文,之前的physdreamer和ipman复现都失败了,一方面是因为我没有经验,另一方面是他们的readme写的太狗屎了,pip install的脚本甚至还能写错。记得当时复现微动放大(后面就简称EVM吧)的时候,要把一个大叔的脸变得红绿状态切换,为了实现这个我找了好几份代码,有些代码能够放大,但是会有很多噪声,整个背景都是那种白雪花,很多噪点,这个一方面和代码质量有关系,一方面和设置的频率参数有关系,当时调了很多遍参数,效果都没有论文视频中展现的那么好,最后我重新找了一份代码,放到服务器上跑了一遍,出来的效果非常棒,因为代码中的参数正好适配论文给的数据集,我只需要运行代码,不用调参,所以效果很棒。当时我高兴了很久,婴儿的呼吸被放大,血液的流动被放大…实现的那个时刻,是凌晨2:14。后来,我开始解决空间物体角度计算的问题,很简单,只需要通过相机内参+简单的反三角函数就解决了,再后来就是在服务器上部署qwen3vl,那是一段痛苦的经历,折腾了很久,环境都配不好,最后让师兄配师兄也配不好,可能是服务器硬件出了问题…CUDA软链配置上,但是torch检索不到。后面给我换了一台服务器,一会儿我就部署成功了,硬件问题往往是最后考虑的bug,也是最折磨人的bug。与此同时,11月,我开始开发机器人队的下位机通讯,用了大概两周的时间完成下位机和电机之间的通讯,这个过程还是很有趣的,不断的让ai写代码,然后分析Bug,不得不说gemini非常强大,大部分都能编译成功,但代码中的参数还是得我自己修改,要不然真就出现电机伤人事件了哈哈哈。还记得gemini写出了转速200,k_p 400的参数,着实吓了我一跳。最后由于通讯频率的限制可以通过上位机解决(没错就是latency_timer,我也不知道为啥队里没有人注意过那个参数,我之前一直开发下位机,上位机的测试时另一位队友,不知为啥没发现那个问题,最后我下位机开发完,测试上位机的时候就发现了这个参数没修改,默认是16,把这个改了频率就上去了…而从我接手上位机到发现这个bug ,一共也就不到半个小时,虽然我之前不知道有latency_timer这个东西,但是我猜测到可能是Linux系统限制了通讯频率,问了下ai,上网找了找资料就确定了bug在哪里)。不过开发下位机的过程还是非常有趣。写到这里,其实感觉自己做了很多事,但确实没有一个fantastic work,所以还是不太满意,充分利用好时间,是能做更多的事的。

​ 写到这里,马上也到校车发车时间了,先暂时停笔,回学院路吧。本来写这个博客是想找个方法,让我能够投入身心去复习基物的,可现在写成了life review,那么标题就叫做review life吧

以下是博雅的学期总结,随便写写

​ 有点好奇这个文档有谁会看,网盘里没有设置权限,也就是说任何人都能看到这篇文档,那我自然不会写什么有趣的东西,本来打算AI直接应付节省时间,但想了想,还是看看800字能耗费多少时间,毕竟抽时间写一写东西还是挺重要的。之前博客里对这学期已经做了些回顾,那我就写一写博客里没有的东西。
​ 大一有些迷茫,上了大学,为了纸面成绩去刷题,去刷高绩点,感觉过的和高中一样,没有一点意思,但受限于专业分流,只能先应付考试。但今天看来,我对大一的学习还是很失望的。我记得我最喜欢的一门课程是线性代数,北航把这个叫做高等代数。线代应该是大一唯一一门我喜欢学的课程,这个可能和当时我在学支答疑部负责高代答疑有关系。线性代数是一门非常优雅的课程,我记得我当时在图书馆听Gilbert Strang的线性代数课程时,仔细的思考矩阵的秩究竟代表什么,Gaussian Elimination原理是什么。很多公式的推导都非常有趣,我从小就喜欢想象空间,以一个FPV的视角,在想象中的世界穿梭。而线代就是一个空间变换的艺术。可是,今天当我看到一个题目,考点是代数重数和几何重数,我却一点知识都想不起来。我记得我在群里问过老师,几何重数、代数重数与特征子空间的关系。可是现在我对于这些词语,仅仅只是熟悉,具体的定义与应用,一点都想不起来了。上一次用线性代数的知识,还是在推导IPM单应性矩阵。连我喜欢的课程知识都已经忘记,那可见其他课程的知识我掌握的情况如何。我从来都不喜欢用绩点衡量这门课程是否学的好,因为我本来就不太喜欢往习题上下功夫,我只希望能够学到自己喜欢的知识,可是学习了却没记住,显然,我的大一是失败的。回到这学期,我将时间投入了我喜欢做的事情,虽然有一些成果,但并没有达到我想要的结果。并且我因为这些事放弃了很多东西,但得到的收益不是很好。或许当初应该完成特级赛道,那并不难,只是需要时间调试而已,可是由于当时急于开发下位机,放弃了。回头再看,下位机的开发没有任何必要,因为通讯频率被上位机的latency_timer限制,直到下位机开发完成,在调试上位机时,我才发现这一点。真的是浪费了很多时间。这学期很少自己写代码,大部分代码都是AI完成,因为AI效率太高了,一个软件我可能花几个月才能写出一个Demo,而ai只需要几分钟,就能生成一个Demo,耐心的改几个小时,就能够达到我的需求,在开发下位机时,很多代码都是AI在写,我只负责看看参数设置的对不对,函数结构有没有问题,编译能不能通过,电机能不能正常驱动。AI进步十分迅猛,我不得不思考未来应该发展。可以确定的是,数据越稀缺,越难获取的方向,能够较晚被AI取代。
​ 花了27分钟,打字还是很慢。

12.30

​ 这篇博客写的时间点很有趣了,12.30晚,是让我心力憔悴的一天。上午早八,上课的时候注意力还是不集中,回到宿舍后玩了一会mint,然后在Ubuntu里改了下状态栏。问题就出在这里,由于我的清华源一直加载不上,我就换成阿里云,正常的apt update , 我特意没有upgrade,因为我之前的系统崩溃就是因为很久没有update,突然update,upgrade后导致库的关系混乱,各个依赖全部丢失。所以这次我只是update后安装一个插件包。中途弹出了一个页面,我现在有点忘记是什么页面了,是什么lib来着,当时的我确实犹豫了一下,想到了可能会使系统崩溃,但是我觉得就一个插件包,应该没什么,当时安装vscode和别的软件的时候,也弹出过类似的页面,所以直接点击。点击后,我看到命令行里一大堆解除依赖,其中还卸载了很多ros2的库,我就意识到问题不对,可是为时已晚。重启后系统就奔溃,这次我没有尝试什么recovery,因为关键的文件我要么上传到github,要么备份到了机械硬盘。但当时我忘了自己备份过,只是很沮丧,觉得为了一个插件把系统整崩溃很不划算,于是不想浪费时间,直接重装系统吧。怎么说呢,其实重装的过程很简单,但是等待下载,配环境这个过程很费时间,而且我之前配的什么输入法,什么鼠标滚轮的速度,还有什么开机自启动的软件什么的,全部都要重新查找重新配置。大概浪费了我两三个小时在上面。中午开组会的时候我就决定以后不使用Ubuntu作为主力机了,但换什么系统没想好,主要是那个Ubuntu自带的软件商店打开的特别卡,安装别的deb包有时候好用,有时候闪退,让我很讨厌,所以初步决定换mint,可是我的mint装到了移动硬盘,所以用起来还得找硬盘。不过大概率没那个精力去换一个系统,我绝大多数时间都在和Ubuntu打交道,所以换系统也会换到Ubuntu系列的mint,但是mint的美工不太行,可能后面还是得装Gnome。系统崩溃到重装系统就浪费了一下午时间,然后刚装好系统,配好grub,买的3T的机械硬盘就到了,唉,这个时间段存储都开始涨价,我担心后面急需存储的时候买不到,就先买了两个500G的固态,一个500移动固态,和一个3T的机械。其中一个固态装到笔记本内部,运行ubuntu,还有一个固态装到硬盘盒里, 运行Mint。这个硬盘盒实在是很鸡肋,29号晚上装Mint的时候,重启系统后进入Grub,怎么操作都没用,进入windows后连硬盘都读不到了,我以为是我哪个步骤错了,或者grub文件有问题,操作了好久。最后想插拔硬盘试一下,结果打开硬盘盒发现硬盘引脚掉出来了,硬盘根本没接上!😂😭😭😭😭这个抽屉式设计的硬盘盒真的很糟糕,硅脂片根本没用,因为根本不能和外部的金属贴合,就是这个垃圾的抽屉式设计的锅,买的时候没想过这么多,还是吃一堑,长一智吧。晚上考coding theory,没错,折腾了一下午,根本没有复习,考试的时候很难受,学过的都忘记了,在考场上真的很羞愧。讲这门课的黄勤老师很优秀,设计过北斗卫星的编码系统,遗憾的是我对这门课不感兴趣,我很喜欢线性代数,因为它和空间有关,用代数去表示多维的空间很有意思,但是这门课用到的线性代数只是一个计算工具,也可能是我学的不好,决定这只是一个工具。导致我对coding一点不感兴趣,什么香农极限,听起来还不错,但写起来我就不喜欢。所以这门课我时听时不听,忙别的事情。但是黄勤老师讲课很好,因为他讲课的时候自己在思考,很多老师讲课很枯燥的原因就是他没有很好的思考,知识点不能简单的讲述出来,固然严谨的概念很重要,但简要的阐述更容易让学生理解。关于讲课的问题我就不多说了,我也能理解老师们,因为讲好课的投入产出比太低了,对老师个人来说,不如将时间投入到项目上去。最后交卷的时候,我是先收拾好东西,穿好衣服,背上书包才去交卷,因为我不敢和老师对视,不敢看到他看到我卷子后的表情。以往我在他的课上还是挺活跃的,但是最后的考试这么差,我确实很羞愧。考试的过程中,我右边的同学全程拿手机作弊,看着他写完卷子提前交卷,我心里也很焦躁。但我宁愿得到一个失败的结果,也不会用错误的方法得到好分数。

​ 交完卷后我就非常沮丧,不过到食堂吃饭的时候,心情好一点了。当时知乎上刷到关于meta收购manus的一篇帖子。这个新闻我上午看到过,觉得钱确实给的有点多了。我之前没用过Meta的模型,因为Gemini实在是太好用了,手上好几个谷歌账号,正常情况下一天根本用不完,但可能过几个月,ai studio就会有限制了。那时,可能我会转向grok或者qwen,grok主要是太喜欢胡说八道,总是说一些“模仿人类”但是没用的话,比如:“我保证,这次一定能行!” ”这是终极核弹版代码!” 结果代码一运行就报错。扯远了,Meta的产品我知道有ai眼镜,好像pytorch也是他们在维护,奥还有开源的llama,但是我目前还没用过,用的最多的开源模型还是qwen,不得不给阿里点赞,qwen做的真的很不错。20亿刀收购有点多了,虽然我没用过Manus,但是一个Agent项目应该不值这么多钱。但是知乎的文章从另一个角度谈这次收购。他认为manus的团队比产品的价值更大,也许扎克伯格是希望manus的团队加入Meta,我觉得这也有道理,人确实比产品更重要。我之前想过做agent有关的项目,部署到PC端,不过学期没有时间,而且我看到有很多类似的开源项目,准备寒假的时候试一试。我目前想到的瓶颈主要就是多模态的延时问题,消耗的token很多,处理一次又要耗费很长时间,这个flow怎么设计确实很关键,现在的我还没接触,只是觉得很有意思。我有很多想法。比如当前的阅读模式比较无趣,只是上下滑动,当然这里我指的是长文的阅读比较无趣,我想做的是类似于思维导图一样的,节点式的阅读,把长文分解,一次显示一部分文字,然后想思维流一样阅读,读完一个节点启发下一个节点,每个节点内容饱满,同时整个长文结构很清楚,读完后回顾觉得条理很清晰,当然这只是一个很浅显的想法,有很多不足,比如滑动到上文的方式怎么设置等等,而且这个阅读方式对写作者的要求很高。还有一个想法是关于输入的,我一直觉得用键盘输入很不好,这么多年一直用键盘输入,速度很慢,当然这是因为我盲打没练出来,打字速度太慢了。但是除了键盘这种输入,我想不到别的方法。语音输入有很多问题,首要就是隐私性问题,干扰他人,还会让输入的信息泄露,其次就是没有人能保证一次就说对,所以一定会停顿,会删改,这就导致还需要键盘介入。这个问题我想过很久, 我觉得AI与人交互最好的方式还是直接通过语音,也就是真正的和一个博学多识的人,一个无所不能的人,一个言听计从的人交流,这是我理想的交互方式。我觉得这是未来的趋势,大多数人不需要多么高级的代码生成功能,大多数人需要一个能听懂话的手机,能听懂话的电脑,能听懂话的机器人,说一句话就把所有事做完了。这也就是Manus的应用场景。其实以往可以自己写脚本,自己去设计每一个任务的流程,但显然不适用所有人,由于我没用过manus,也就不好评价什么性能,但应该是没那么那么惊艳。2025年,让我最惊艳的,还是第一次使用replit。当时我还是使用手机端的replit,我看着ai自己设计流程,看着步骤一步步地跳出,看着代码一行行的生成,我看到他自己运行网页,自己点击按钮,自己debug,最后完美生成了我想要的样子,而这一切,都是在我的小小手机上完成的,虽然我知道手机只是一个显示,真正的处理在服务器端,但当时给我的震撼太大了。为了完成这个程序,我刚开学就学习cpp,耗费了一周左右,才把基本的语法掌握,能够写一些小型的cpp程序系统,知道析构什么的,甚至都没真正开始设计想要的程序,而我想做的这个程序,replit只用了20分钟生成。我想,没有任何个人或者团队,能在20分钟做出这样的网页,尽管这个网页很简单,但它做的太快了,那时我才意识到AI的强大。2024年时,我就开始使用deepseek,当时它的能力还不错,用的人也少,作为GPT的下位替代,写写数学题什么的还是很不错的,结果到了25年初,deepseek突然火爆,还是挺好的,相比之下,优秀的qwen就没那么大热度了,阿里的能力很强,只需要一个契机。回到与AI的交互这个话题上,我觉得最好的设备就是智能眼镜,现在的中国,戴眼镜的人相当多,市场相当大。而且眼镜本身的位置就是一个完美的麦克风,完美到没有人会注意到你佩戴了一个麦克风,这体现在我日常在宿舍和家人视频通话时,舍友都分不清我是在和他们说话还是在和视频说话,眼镜真的非常重要,可以看到,今年夸克,Meta等企业也在眼镜上发力。我觉得目前的瓶颈还是在于多模态的交互速度,不知道这个会用什么方法突破,但一旦AI能够与人实时交互,那一定会带来一大堆产品的迭代,一旦小型的语言模型能部署到手机本地,甚至让MCU运行一个模型,那也会带来一个产业的革命。是的,我觉得本地化部署非常重要,根本原因就是延时的问题。当然,如果你一直呆在一个信号良好的环境,并且在线调用模型的速度瓶颈突破,那么本地的部署或许没那么重要。我比较喜欢所有的应用都能在网页上运行,也就是每个人的电脑只是一个接口,接入互联网,接入千千万万个云电脑,代价是隐私,但是性能一定会提升很多,不需要本地买多么贵的硬件设备,云端就能流畅运行所有程序,当然这或许只是把一次性的成本分散成持续投入的成本,但我觉得这是未来,这和云电脑其实不太一样,本质是打通了各个APP的壁垒,在浏览器中运行APP,或许会有很多不同APP之间的交互,也会有许多有趣的插件,但这又有其他的很多问题,这我就不想深究了,总之 我觉得网页端的app是未来的趋势。

​ 今年另一个很火的领域就是具身智能了,VLA,VLN领域的论文发了很多很多,但我觉得近几年实现具身智能的落地有很大困难。模型的训练关键之一就是数据,可以发现,LLM和VLM都有庞大的数据,文本、图片和视频的数据量非常大,因此用于大模型训练可以说是绰绰有余,但是和真实世界交互的机器人的数据,就非常稀缺。因为这不仅仅是文本,图像,还涉及到物理层面的感知。一个电机,不能随意的被驱动,模型要获得掌控电机的能力,就需要很多数据,可是数据从哪来?一个方法是仿真,但是Sim2Real的鸿沟依然存在,仿真只能去检测模型的能力,实际上落地还是需要现实世界的数据,当然,我现在所说的都是自己的想法,写之前并没有查阅什么资料,只是自己的胡思乱想,当然会有很多不严谨的地方,不过还是写下来好一点,这样未来也好纠错。也可能未来有新的方法,新的模型能够打通Sim2Real。所以我觉得目前具身智能发展的瓶颈就是数据,数据量大了,端到端最后训出来的效果才好,可能也不一定,但这就是我目前的想法。每一个企业生产的机器人的各个关节的位置都不一样,那么训练的数据能否通用呢?我不得而知,但是宇树已经造出来了相对便宜的硬件产品,各个机器人研究团队也在使用宇树的机器人进行科研,这是好事,这样follow别人的工作就相对容易,就能尽量把精力投入机器人的”大脑“,而不用发愁机器人的硬件。(注意,后面集中讨论的是“人形机器人”)但是说到底,有一个问题还是没有解决:就算造出来了一个能力很强的人形机器人,他的应用场景在哪里?场景当然有,但是市场一定不大,因为大多数人没有钱,不会花几万甚至几十万去买一个机器人,人动一动解决的事情,没有必要花很多钱买一个大铁块代劳。工业场景又有专为场景优化的机器人,比人形机器人的效率高多了。我觉得明年资本市场就应该会减少对人形机器人的投资,他们可能看到AI发展的这么迅速,好像有了自己的意识,那把AI迁移到机器人上应该很快吧,技术上说服他们是没用的,时间会证明我的观点。当然我希望我的观点是错的,我希望真正感知世界的机器人早点到来。明年人形机器人的市场应该会冷清吧,对AI的投资应该也会缩减。因为真正厉害的模型都在大公司手里,就算你有一个很好的模型想法,训练是需要卡的,是需要算力的,说白了,是需要很多钱的,也许一次训练的钱就能买几个小AI初创公司了。AI的市场,emm, 我觉得很大,但是想不到一个很好的盈利手段,现在AI已经和我的生活无法分割,将来是每月付费使用AI,还是什么别的手段来盈利,这应该是很有趣的一点。我的观点是机遇在融合AI的硬件市场,人们可能还是更喜欢买一个实物来和自己交互,和自己的实际生活交互, 当然这是我自己的观点,我还是觉得一个具有灵魂的硬件产品比一个软件产品更好。总之我觉得下一个吃螃蟹的,应该就是本地化部署AI的硬件厂商,这点我很看好小米。

​ 洋洋洒洒的铺垫,已经到了12.31号了,开始总结2025年吧!