从 AlphaGo 到 ChatGPT,AI 浪潮下一名普通 00 后的十年
毕业工作后,博客月更似乎已经成为奢望。日复一日的工作的确让人少了许多输入和输出的时间与精力。今日机缘巧合,突然想记录如今这一波 AI 浪潮下,一名普通 00 后视角下对一些标志性事件的个人印象和经历。拥抱 AI,也许是这个时代必须做出的选择。
2016 春:AlphaGo
虽然如今 AI 这个词已经随处可见,人脸识别、指纹识别和语音助手等早已融入我们的日常生活。但是在我的记忆中,第一次听说人工智能这个概念,还要追溯到 2016 年。
2016 年 3 月 15 日,韩国首尔,历经多日的李世石与 AlphaGo 围棋人机大战以 AlphaGo 四比一击败李世石结束,标志着围棋这一公认的人类智力巅峰,也被 AI 拿下。也许是在几天后,也许是在几个月后,这一消息总算被当时还在读高中的我所知道。不过可惜自己并不会下围棋,只知道这应该是最复杂、最挑战人类智力的棋类游戏;也并不知道 AlphaGo 战胜了李世石意味着什么。
尽管 AlphaGo 击败李世石这一消息在全世界广泛传播,但当时的我对这一消息似乎是左耳朵进右耳朵出。当时作为听话的高中生,围着高考这唯一的、确定的目标,也只是继续日复一日的学习、刷题,很快就将这个消息抛之脑后。当时的我无论如何也想不到,AlphaGo 背后的人工智能,会对自己日后的专业和就业产生多大的影响。
时间就在日复一日的刷题中飞逝,直到来到 2018 年夏。
2018 夏:初窥 AI
高考结束后,第一个问题就是如何选择专业。当时对专业与就业这件事情只能说是啥都不懂,不过好在有靠谱的家人长辈咨询,最终选择了计算机专业。
在结束志愿填报后,我读了李开复老师的《人工智能》一书(已经忘了当时具体是如何知道这本书的),通过这本对大众的科普读物,对 AI 这一概念有了更加具象化的了解。这里,复制粘贴一下微信读书上这本书的官方简介:
人工智能将引领一场比互联网影响更为深远的科技革命!智能革命时代先行者李开复、王咏刚解读AI如何重塑个人、商业与社会的未来图谱:人工智能时代,个人与企业如何找到人机协作的新位置;人工智能将颠覆现有的商业模式,不仅在高科技领域,任何企业都需要尽早引入“AI ”的思维方式;人工智能将部分取代人类的工作,程式化的、重复性的技能将失去价值。我们的工作必须具备足够的深度,让自己强大到不会轻易被机器撼动。秒杀你对人工智能的一切疑问,好读易懂,有趣有料。
以及一张网上找到的高糊版目录的一段截图:
在如今的后 ChatGPT 时代,看到这本 17 年出版的书籍部分内容似乎已经不那么正确了,也挺让人感慨 AI 的飞速发展。
9 月入学之后,抱着继续了解下当时最热门的 AI 的心态,选修了当时我所在的计算机学院的院长开设的一门面向全校新生的选修课:《智能科学与技术漫谈》。由于是面向本科新生的通识选修课,课程内容其实基本上以图片、视频为主的科普,并不涉及任何具体的 AI 相关技术和算法。其实这门课程的内容我现在已经基本忘光了,但是仍然记得这门课最后的考核是写一篇关于自己对 AI 的应用畅想的小论文,我写的内容大概是关于利用 AI 技术帮助盲人更好的感知这个世界以及与这个世界交互。
而 18 年到现在,笔者现在的工作内容和当时小论文的畅想是毫无关系,也许梦想终究敌不过现实吧。而开设这门选修课的院长,以及参与其中某些主题授课的老师们,现在有好几位已经跳槽到其他学校了。又是不免让人唏嘘。
2020 秋:机器学习不会学
在 18 年结束了对 AI 的初步了解后,学校后续的课程安排其实和 AI 的直接关系就并不大了,都是数学基础、程序设计相关的专业基础性课程,自己也并没有进一步学习和了解 AI 相关的知识。直到大三上学期的 2020 年秋,必修专业课 《机器学习》才让我对 AI 有了切身的了解与体会。
由于课程名是机器学习,因此课程内容自然是传统的线性回归、SVM、贝叶斯等传统机器学习相关的内容,自然对数学的要求比较高。可惜我并不懂数学,矩阵求导公式我是拼尽全力无法理解和记住,只有想一想矩阵中的每个标量元素,才勉强可以理解一些矩阵求导公式为什么成立。尽管付出了不少,但是最终这门课程的成绩并不太理想,算是追逐 AI 路上遇到的第一个坎了。
结束了这门课程的学习之后,我曾有一段时间下定决心不读研不搞 AI 了,找个开发岗直接本科工作算了。可惜实力有限秋招受挫,最终还是选择了本校读研苟一苟。而当时本校的老师基本做的都是 AI 相关的,在当时综合考虑之后,我也选择了做学院内最多数的选择:计算机视觉。
2022 冬:ChatGPT
22 年 9 月进入研究生阶段,在接触一段时间计算机视觉之后,我遗憾的发现:我不懂数学和机器学习,更不懂深度学习和计算机视觉。在经过了几个月的读 paper、做实验、没效果、自我怀疑的循环后,到 2022 年冬季,发生了那件我们都已知道的事情——ChatGPT 发布。
2022 年 11 月 30 日,OpenAI 发布了 ChatGPT。在不到 1 个月后的 12 月,我在和同学聊天时知道了这个事情。当时的我没有自己去进一步的试用和了解这一现在来看划时代的产品。而在 2 个月左右之后,大概是春节之后,ChatGPT 终于引爆了全球网络,这个可以聊天,似乎无所不知的对话程序,已然世人皆知。而它也开启了这一轮以 LLM 为代表的 AI 热潮。
ChatGPT 的爆火让另一个概念:RAG 及其背后的向量数据库也出现在大众面前。由于在 CV 方向的挫败,在深思熟虑之后,我选择了不继续做 CV,而是转向了向量数据库和近似最近邻检索,算是既能够跟着 AI 混口汤喝,又相比深度学习能够更有一些 certainty:知道一个东西为什么能够 work 或者为什么不能 work。
在学习数据库系统、近似最近邻检索一段时间后,时间很快来到了 2024 年:该考虑实习和工作的事情了。
2024:择业
在研究方向转向向量数据库之后,我自然学习了数据库系统的相关课程。于是实习也便投递了数据库相关的岗位。所幸运气不错,由于对近似最近邻检索有一点了解,我没有被八股文拷打,比较顺利的找到了一份暑期实习。
实习打工的日子过得飞快,在结束实习后便在 9 月正式开始了秋招。我投递的岗位以数据库开发和普通的大类后端开发为主。当时的我并没有想到,虽然自己似乎和 AI 关系并不大了,但是最终选择的工作却和 AI 紧密相关。在 12 月,综合考虑了方向等因素后,我最终选择了一份和当初投递的数据库、后端开发都关系不大的模型训练岗位,算是兜兜转转还是回到了 AI 的怀抱。时代的浪潮,终究会影响到身处其中的每一个人。
2025:白银时代
2025 年,以 DeepSeek 为代表的模型让 RL 后训练技术受到了空前的重视。毕业入职后,我也做了一段时间的 RL 框架相关的工作。期间阅读学习了不少知乎大佬的文章,这一小节的标题便是借鉴自:大模型Infra这些年,从黑铁时代到黄金时代再到白银时代 - 方佳瑞的文章 - 知乎 。尽管后续没有一直做 RL 框架相关内容,但是在进行其他相关工作时,我也隐约感觉到在目前算法侧基本没大的变化的前提下,工程侧在做的很多优化都已经非常精细化了。在 Infra 刚开始受到重视的年代,一个功能被实现就已经很不错了,而现在则需要在实现的基础上进行细粒度的优化。
就本人浅薄的视觉来看,自 ChatGPT 之后,以 Transformer + 自回归为特点的 LLM 其实没有发生太大的变化,所以 Infra 侧的需求总有做完了或者难以再继续优化的那一天。而目前的 LLM 范式,究竟是不是通往真正的 AGI 的道路,本人其实也是持较悲观的态度的。所以,幻想着有一天能够有新的、有更大可能通向 AGI 的范式出现,这样作为 Infra 侧也能跟着混口汤喝。
尽管有着怀疑和忧虑,AI 的浪潮终究要势不可挡的向前。万千思绪化作一句:路在何方?路在脚下。