第(3/3)页 “但是我用了TenSOrFlOW之后,发现事情完全变了。这感觉就像是在搭乐高积木。” 苏晚晴挑起眉毛,表现出很感兴趣的样子。 “搭乐高?这个说法很有意思,能具体解释一下吗?” 顾超凡坐直了身子。 “你看,乐高玩具的每一个模块,不管它是长条的、方形的还是圆形的,它的接口都是标准化的。我不需要知道这个塑料是怎么倒模出来的,我也不需要知道它的材料成分是什么。我只需要知道,我把这个模块插到那个模块上,它就能拼出一面墙,或者一辆车。” 顾超凡越说越兴奋。 “TenSOrFlOW给我的感觉就是一盒超级强大的数字乐高。它把那些最复杂、最难懂的底层数学运算全都打包封装好了。我只需要调用它的API接口。” 他用双手在空中模拟着连接的动作。 “我要加一个卷积层,啪,调用一个模块;我要加一个池化层,啪,再加一个模块。这帮我屏蔽了所有的底层复杂性。” “而且每一个模块应该怎么样使用,在什么样的情况下使用,官方的文档里面,都给了比较详细的示例代码和教程。” 苏晚晴看着他专注的表情,继续发问。 “也就是说,你并不需要理解每一行底层代码的逻辑,也能完成顶尖模型的训练?” 顾超凡非常坦诚地点头。 “是的。外网那些大牛管这个叫深度学习前沿研究。我倒感觉这种操作像是‘炼丹’。” 苏晚晴笑了出声。 “炼丹?为什么这么叫?” 顾超凡也跟着笑了起来。 “因为很多时候,我也不完全确定为什么加了这一层,准确率就会提升。” “我就是在框架里不断地调整参数。” “改一改学习率,调一调批次大小,然后把数据喂进去跑。” “就像古代道士把药材扔进炼丹炉里,看看最后能炼出个什么东西来。” 他收起笑容,语气变得认真。 “但是,能够让我这样不断试错、不断‘炼丹’的前提,是这个丹炉必须足够好用。” “TenSOrFlOW帮我处理了显存分配、跨硬件调用这些最麻烦的事情。如果让我自己去写CUDA代码来调度GPU,我估计写三年都写不出一个能跑的DemO。” 第(3/3)页