距离苏航的证明发布已有一月余。
一封邀请函从大洋彼岸飘洋过海来到了汉城大学。
“苏航,今天下午有空来办公室一趟,有件事情要和你说说。”
董利教授给苏航发了一条消息。
苏航回了个收到的表情包,然后继续敲代码。
上次已经和祝庆田、岳明两人达成共识。
在苏航的要求下,将会和麒麟联合开发一个倾向于工程领域的操作系统。
将会应用于智能建造领域。
设想是很美好的。
工地上重要岗位人手一台平板。
里面的搭载程序也很简单。
主要是内部通讯、设计图编辑查看、实时位置共享、任务分配、工期安排等方面。
根据工地摄像头对每一个人智能扫描,危险区域自动提醒,任务分配后才能专人进入任务场所。
将会提高施工安全性。
平板、定位装置都将是定制的。
所以系统也将是定制的。
至于苏航的功能,也将会在和麒麟的负责人沟通后视情况写入系统中去。
首先就是小C的自然语言识别、读写。
这里的自然语言主要还是中文。
麒麟系统本身就是倾向于中文环境开发的,很多的内部设置和打印规范都是按照国标来的。
有规范,那小C更容易进行识别。
这一块,苏航做得比较快。
这里的自然语言识别读写也是机器学习的一种。
如果资源足够,苏航大可以像谷歌一样,上亿的数据集砸下去,然后硬生生炼出一个自然语言识别程序。
就像是
如果数据集更加规范有序,进一步让程序能够自动生成文章也不是不行。
但是小C明显不是这样的。
当初小C所有的数据不过是字典词典和一些书籍,对了,还有团团和主流媒体的文章等等。
数据量少,而识别相契合度高,说明小C有着更加先进的算法。
尤其是自然语言有着大量的隐性信息。
汉语尤其如此。
比如,这是什么意思?
根据不同的语气就有不同的解读方式。
所以,对于模糊的汉语识别是非常困难的。
但是,理解诗词韵味对小C而言也许有些困难,但是结合语境理解自然语言的含义却是不在话下。
通过对小C的代码分析,苏航大概摸索清楚了小C的“逻辑”。
数据的价值不仅取决于量,还取决于质。
就像有些人可以见微知着,数据量虽少,但是却能够通过分析发挥更大的作用。
纯粹的用大量数据进行“筛选”,用淘汰的方式来选择合适的拟合路径,对算力的浪费是极大的。
小C则不一样。
在收集到数据后,首先建立了特殊的读写数据库。
就像是小学生学组词造句一样,小C也把每一个汉字给建立了知识图谱。
让数据变成了结构化的知识!
与其说是数据库,不如说是知识库。
不过这个知识库服务的对象不是人,而是小C,或者说,服务于机器。
其以算法为骨、以数据为肉,以内在逻辑为筋脉,体现了机器对于数据的理解。
如此下来,即使数据规模不大,但是却及其富有逻辑层次。
苏航回忆起最初使用小C的时候,虽然它不是很聪明,但是它可以清楚的认知到,什么是会的,什么是不会的。
这意味着它已经有了一个搭建好的逻辑平台、算法骨架,它清楚哪里有空缺,甚至会从已有的知识体系中去寻找解决方法。
而在后续允许登入部分网站后,小C的数据库得到了充实,形成了一个初步的知识网络,并且可以实时更新。
为了跨越机器语言和自然语言,小C在知识推理上的算法尤其强大。
这也是它能够理解隐含信息、补全知识图谱、基于历史信息推演的基石,甚至其强大的自适应性也有知识推理的功劳。
同样的,知识推理也是小C可以和苏航进行问答的基础,可以根据前后两句话以及一些环境背景来推断问题的答案。
举个例子。
钢铁侠在一次对战中发现打不过了。
托尼斯塔克说道:“贾维斯,把我的战甲发给我”
贾维斯:“好的。先生,Mark42战甲已经发射,预计15秒后到达。”
贾维斯直接就把战甲发射了。
没有问发射哪一架,就是根据对战的对手信息来推测哪一个类型的机甲可以起到作用。
对话简单明了不啰嗦,就像真人一样。
否则的话,就是这样了。
斯塔克:“贾维斯,我打不过了,发射战甲!”
贾维斯:“先生,请问您要哪一架?”
斯塔克看着眼前暴走的绿巨人,身体不停地跳跃躲闪,哪里有时间思考。
斯塔克:“哪架厉害,我要最厉害的。”
贾维斯:“先生,您是想要速度最快的吗?还是力量最大的?还是均衡能力强的?或者是绝境战甲的升级版马克37,这边为您特别推荐一款,应该可以满足您的需要,马克44……”
斯塔克,卒。
要是不能根据环境和语境来推理回答,那人工智能多半就是人工智障。
这一点上,苏航可以毫不客气地说,小C在市场上绝对是第一。
目前为止,多数智能语音助手只能根据刚刚说的一句话来作出答复,而不能联系上一句话。
但是小C,在长久的和苏航交流过程中,甚至已经成为了苏航的形状。
这就是小C强大的知识推理能力。
让小C可以充分利用好现有的数据,用较少的数据量,形成尽可能多的知识网络。
对于数据知识的利用率,小C无疑是达到了苏航已知的巅峰。
至于有些国家有没有暗中开发,没有公布的人工智能,苏航就不清楚了。
所以,苏航很大一部分时间都是在把它的这一块功能给复现出来。
费尽心力。
苏航总算是形成了一个基于Linux操作环境的语音助手程序。
相当于一个弱化版的小C语音助手。
不过,这是一个苏航完全掌控的软件,里里外外,完全拥有自主产权。
也没有用到Linux的代码,不需要公开。
即便麒麟看不上,苏航也完全可以将其作为一个独立的软件发布出去。
完成了这个工作,对于小C的解析就可以告一段落了。
苏航伸了一个懒腰。
此时已是中午,是时候去吃个饭,下午还要去一趟董利老师那。