第四章放学后的他与她(1 / 2)

放学路上行人很多,正值六点钟左右的晚饭时间,街上多是赶着回家的人。

白天还阴沉沉的天空,此时倒已经阴云散尽,西边那颗大柿子红彤彤地低垂着,肆意挥洒着余热。

林卿之骑着自行车一路疾行,花了不到十分钟就到家了。

在车棚停车的时候,林卿之注意到小区里的保安和物业都在忙着检查消防设施,似乎还请了两个消防员跟着指导,看来昨晚的火情已经引起他们的重视了。

林卿之见他们没有注意到自己,也就自顾自地上楼回家。

他家在10号楼1001室,是一间三室两厅的大房子,大约140平左右,是他爸爸十年前买下的。

住到现在,家具内饰什么的都已经显得有些老旧了。

回到家打开灯,家里空空荡荡、冷冷清清的。

早上随手扔在沙发上的外套还摊在那里,明明外面暑气未消,家里却显得暗沉沉的,好似空气都被冷藏了。

一股难掩的孤独感涌上心头,林卿之失落地放下了书包。

叹了口气后,他打开了卧室旁边的小房间,露出了里面的那个小书房。

书房里有一个很大的电脑桌,三个巨大的显示器围绕着电脑椅,像是三只凑近着随时准备审视某人的巨眼。

桌上还有一台泛着彩光的电脑机箱和一台小型服务器,凌乱的数据线随意的在桌上和地上散布着,把一台台设备逐一连接起来。

此时电脑椅上没有人,但是电脑桌上的设备全部高速运转着,一行行数据正在快速刷新,不知在写入着什么。

三台显示器围成的桌面小空间里,密集地摆放着两个鼠标、一个机械键盘、一个桌面小风扇、一个小插排、一瓶眼药水、两本工具书、半包薯片和一个水杯。

这是独属于林卿之的小世界,是他工作学习的圣地。

拉开椅子坐下,林卿之随手拿起桌上的杯子喝了一口。

“啧……变味儿了?”杯子里的茶包早已泡成了黑色小馒头,林卿之“呸”了好几口。

“还行,没什么问题,学习很顺利。”

林卿之满意地点点头,他这次花了一个月的时间自己编写了一套GRU模型程序。三天前正式开始了无监督训练,目前看来训练还算正常。

GRU模型是一种循环神经网络(RNN)的变体,它通过使用门控机制来克服传统RNN中的梯度消失和梯度爆炸的问题。

而RNN就是循环神经网络,是一种使用序列数据或时序数据的人工神经网络,常用于解决顺序或时间问题。它具有记忆性、参数共享并且图灵完备,因此在对序列的非线性特征进行学习时具有一定优势。循环神经网络在自然语言处理,例如语音识别、语言建模、机器翻译等领域都有应用,也被用于各类时间序列预报。

由于传统的循环神经网络容易出现梯度消失的问题,所以在此基础上,出现了一种新的变体——长短期记忆神经网络(LSTM)。

长短期记忆神经网络有效克服了传统循环神经网络的梯度消失问题,在许多场合得到了应用。然而,LSTM网络的内部机制复杂,有很多参数需要控制,这导致其运算的时间成本相当大。

而RNN模型就是在此基础上提出的一种新的模型,它比标准LSTM模型更加简单,训练速度也更快,并且在性能上与LSTM不分伯仲。

当然了,林卿之花这么大的时间精力去学习循环神经网络的相关知识,并不是无的放矢的。

林卿之参加了今年的丘成桐中学科学奖计算机奖的报名,现在进入了提交论文的阶段。

他的论文题目就是“一种大幅提高计算量的GRU模型”,就是为了解决GRU模型在计算量上的掣肘,让它的理论计算量几乎可以和Transformer模型相提并论,但计算成本上又能保持自己的优势。

这种方法目前在计算机界还没有被提出,具有极高的独创性和先进性,在实际应用中也具有极高的使用价值。如果林卿之的理论能够实现,那可以说是一次计算机领域的巨大进步。

最近几天,林卿之一直在密切关注模型的学习情况。

今天开学一天都不在家,林卿之本来还有些担心会出问题。不过现在看来,模型的学习似乎还挺顺利的。

他的论文已经编写到一半了,接下来就是等着模型训练的成果出来,查缺补漏,将论文彻底完善。

眼看曙光即将出现,林卿之的心情莫名有些振奋。

从小到大他就是在数学和计算机领域展现出了极高的天赋和理解能力,而今年他已经成功地在数学领域证明了自己的实力,现在他的精力转移到了计算机——准确的说,应该是AI领域——他的野心很大,他想要成为全世界AI领域的领路人,要像计算机之父图灵一样改变整个世界!

不过眼下嘛——林卿之拍拍肚子,“饿了……先做饭去吧!”

走出书房,林卿之撸起了袖子。

返回