从古至今,人类观察世界,认知世界并改造世界。
通过不断升级观察世界的工具,技术,获得对世界不同层次的认知。
知难行易,还是知易行难,或者知行合一。
行动是检验真理的唯一标准。
认知都有局限,相对论的颠覆,不影响牛顿绝对时空的伟大; 与量子力学的不统一,同样不妨碍爱因斯坦当之无愧的成就。因为就算是近似,都帮助我们理解了世界,并改造得更好。
但凡自恰必有边界。
地心说固然不对,日心说难道就正确了么?太阳只是太阳系中心,太阳系只是宇宙里的一粒尘埃,卑微到泥土里。
信息无处不在,无所不是;
从观察到测量。丈量世界,得到它的大小,密度,这是数据;
人类进入信息时代,更容易被观察,被量化,被统计,这是大数据;
啤酒放在超市里,有自己的销售情况,尿布也是;
观察、分析啤酒与尿布的销售情况,二者有正相关性,这是知识。然后有意识将二者放在一起,这是认知指导行动。
数据不是知识,数据并不能指导我们更好改造世界,不同人对于数据有不同解读。认知取决于先验积累,知识结构等。数据是客观存在,认知是主观判断,人与人的差距正缘于此。
积累结构化的数据,从宏观视角的GDP/CPI到行业指数,到公司财报。
积累非结构化数据,从图片,语音,视频,更重要是文本,抽取结构化数据。
结构化数据计算可以查询,检索,处理。但仍然还只是数据,客观存在的数据。计算机可以自动处理,并不能有效认知。
如果把人类的知识,历史积累,沉淀进去?结构化数据还不够,还需要有图谱。数据库里的父亲,儿子只是两个普通字段。在结构化的基础上赋予真实世界的关系,我们的知识。
这样才可以推理,关联,联想,甚至自我进化。
深度学习代表的联结学派,有强大的分布式的统计力;
强化学习有对环境的感知与自适应力;
迁移学习,对关联与联想的能力;
GAN能够将分布式的学习成果,具象表达;
而知识图谱,则将人类知识量化成图,融入到上述过程中。
孩童学语,包括了深度学习,强化学习,迁移学习,母语基本是这样学会的。但孩子还要去上学,我们会教他名动形数量代,会教他主谓宾定状补这样的语法。这是我们对语言的总结,这是知识。知识要量化给机器,这是机器得以智能的基础。
关于作者:魏佳斌,互联网产品/技术总监,北京大学光华管理学院(MBA),特许金融分析师(CFA),资深产品经理/码农。偏爱python,深度关注互联网趋势,人工智能,AI金融量化。致力于使用最前沿的认知技术去理解这个复杂的世界。
扫描下方二维码,关注:AI量化实验室(ailabx),了解AI量化最前沿技术、资讯。