1.第四次工业革命
会中提到,我们迎来了第四次工业革命,也就是AI,又名人工智能,有很多问题都能在此期间迎刃而解。并且在此期间有很多的商业机会,比如NPU产业,如今正逐渐壮大。
2.AutoMQ Kafka
AutoMQ的Kafka产品中似乎采用了存算分离的原则,并且存储方面采用S3 Stream架构,会中提到,EBS存储的延迟最低可达60 microseconds,但我认为不太可能真的在实际的使用过程中达到该效果,要考虑到客户的网络环境以及是否拥有合适的条件
3.云基础设施服务。
会中提到,近几年来,AI基础设置服务的可靠性约等于99.999999999%,并且近几年来几乎零故障率。但我觉得这是不可能的,只要是机器就会故障,而且AI这方面的故障率应该也不会小。
4.开源是AI发展的重要力量
会中提到,AI发展中训练AI是很重要的,而训练时用的数据集就需要开源数据的帮助,CCF(中国计算机学会)认为,这些训练数据应该是全人类共同拥有的,而不是某某巨头公司独占的,而且市面上开源与闭源大模型的差距正在逐渐缩小。
5.智能化科技革命会持续一百年(?)
会中提到,智能化革命可能会持续一百年,但是我觉得这个时间没办法准确的估算,所以这样说是不准确的,只能说持续的时间很长,不能直接说一百年。
6.深度学习框架-计图
会中提到,PyTorch架构是外国的,我们中国正在自主研究新一代的深度学习架构,争取能让中国国民们也用上AI。这点我非常赞成,一个国家,不能被科技垄断。
7.AI教育的争议
似乎目前在每一代AI的更新迭代时,都会说“AI能更好的解决教育上的问题”。但中国家长还是喜欢把孩子关进一个教室里,由老师看着,自己“快活”去。
8.知乎直答AI的版权问题
在我与知乎CTO孙斌的对话中,我提了一个问题为:我们在知乎的回答,版权难道不是属于我们的吗?,他回答,这个跟知乎直答没有什么关系,知乎中问答采用的开源协议是GNU,大白话说大概就是:转载需问原作者,标注原地址和转载原因即可转载。也就是我们在知乎上写的问答实际上它的版权是属于知乎平台的,所以知乎有权在人们使用知乎直答的时候直接调用知乎内部的高质量问答。
9.自动代码生成的发展
早起的自动代码补全也就是基于Text文本的补全,不涉及机器学习这类算法,从1996年起intelliSense插件才出现,并集成在Visual Code中,这是最初实现AI代码补全的方法。
10.未来AI行业格局
会中提及的未来AI行业格局类似于一个倒着的三角形,第一层是RAG全量微调,Agents和应用,第二层是AI Infra Service,也就是AI基础设施,第三层是云厂商,基本属于一线,因为大部分企业运营AI采用的都是云上的方案,而不是在本地跑,而且这样还会快一点,因为云上有很多时候是很多台物理机拼起来的,或者是服务器的性能更高,足够日常使用,这才拥有了这么多用户量,第四层是AI芯片。个人认为第三层和第四层是一种平行关系,而非金字塔关系,AI可以在云端运行,亦可在本地/物理机或其他自己搭建的环境中运行。