“这个思路太清楚了!”李明拍着桌子,“双向匹配,再加上规则库,虽然不能解决所有问题,但能解决大部分常见情况!”
张涛指着流程图的一处:“这里,用词频统计做辅助判断,简单但有效。
常见的词组合优先采用。”
王磊看了很久,抬起头时眼睛发亮:“陈总……他真是做互联网的?这思维比我们专业的还清晰。”
贾瀞雯笑了:“他是做互联网的,也是做电影的。
他说过,做搜索引擎和拍电影有相通之处--都要理解人,理解人想看什么,想找什么。”
有了陈浩的图,团队进度快了起来。
但三周后,贾瀞雯发现,有些问题电话里说不清楚。
陈浩手写的一些核心算法描述,只有原始手稿,需要她亲自去取。
她买了飞往杭州的机票,再从杭州坐车到横店。
到陈园别墅时,天已经黑了。
陈浩在门口等她,穿着简单的T恤和休闲裤,头发有点乱,像是刚从片场回来。
“累了吧?”他接过贾瀞雯的行李箱。
“还好。”贾瀞雯看着他,忽然觉得鼻子有点酸。
一个多月没见了。
别墅里很安静。
陈浩的助理已经准备好了晚饭,简单的三菜一汤。
“其他人呢?”贾瀞雯问。
“都回去了。”陈浩给她盛汤,“我让他们别打扰。”
两人安静地吃饭。
贾瀞雯讲北京的事,讲团队的那些年轻人,讲他们的困惑和突破。
陈浩听着,偶尔问几句。
吃完饭,陈浩带她到书房。
桌上堆着厚厚一沓手稿。
“这些都是我这段时间写的。”他拍了拍那堆纸,“有些是算法细化,有些是架构调整。
你带回去,团队应该用得上。”
贾瀞雯翻开最上面一本。
里面是密密麻麻的字和图表,有些地方涂改了又改。
“你熬夜写的?”她抬头看他。
陈浩笑了笑:“反正拍戏空隙也没事做。”
贾瀞雯放下手稿,走到他面前。
书房的光线很柔和,陈浩的脸上能看到淡淡的黑眼圈。
她伸手,碰了碰他的脸颊。
陈浩握住她的手,把她拉进怀里。
这个吻来得自然又急切。
一个多月的分离,让想念变成了具体的触感。
贾瀞雯的手指插进陈浩的头发,感觉到他同样用力的拥抱。
衣服一件件落下。
从书房到卧室,他们没开灯,借着窗外的月光找到彼此。
缠绵比以往任何一次都热烈。
贾瀞雯咬住陈浩的肩膀,不让自己发出太大的声音。
陈浩的手指在她背上留下痕迹,像是要确认她的真实存在。
结束后,两人浑身是汗,却谁也不想动。
“想你了。”陈浩在她耳边说。
“我也是。”贾瀞雯把脸埋在他胸口。
他们就这样躺了很久,直到呼吸平复。
陈浩忽然坐起来:“对了,有件事要教你。”
他打开台灯,从床头柜拿出一张纸和一支笔。
“你看,怎么向不懂技术的人解释技术。”他在纸上画了个简单的图,“比如分词算法,你可以这样说--”
他在纸上写下一句话:“我爱北京天安门。”
“普通人看到这句话,知道是什么意思。
但计算机看到的是一个个汉字:我、爱、北、京、天、安、门。
它不知道‘北京’是一个词,‘天安门’是一个词。”
他在“北京”和“天安门”下面画了线。
“分词算法就是教计算机认词。
就像教小孩认字,先告诉他‘苹果’是一个整体,不是‘苹’和‘果’。
然后他看到‘红苹果’,就知道‘红’和‘苹果’是两个词。”
贾瀞雯看着那张纸,忽然明白了。
“所以你总是用比喻。”她说,“爬虫像蜘蛛,索引像图书馆目录,排名算法像选举投票。”
“对。”陈浩放下笔,“技术细节留给技术人员,但你要理解核心理念。
这样你和团队沟通,和投资人沟通,和未来的用户沟通,才能说到点子上。”
他躺回来,搂住贾瀞雯:“记住,我们不是在造一个高科技玩具,是在解决真实的问题。
人们上网找不到想要的信息,我们帮他们找。
就这么简单。”
第二天,贾瀞雯带着那沓手稿飞回北京。
团队看到新资料,又是一阵兴奋。
陈浩细化了很多关键算法,特别是排名算法的雏形--他提出了“链接分析”的概念,一个网页被越多网页链接,说明它可能越重要。
“这个思路太妙了!”张涛几乎要跳起来,“这就像学术论文的引用,被引次数越多,说明越有价值!”
有了明确的方向和详细的方法,进度快得惊人。
两周后,贾瀞雯正在办公室看财务报表,李明冲了进来。
“贾总!成了!”
他手里拿着一张打印纸,手指都在抖。
贾瀞雯站起来:“什么成了?”
“爬虫!基础版本的爬虫跑起来了!”李明把打印纸递给她,“这是日志,你看,已经抓取了三百多个网页!”
纸上是一行行的记录:
\[XXXX-XX-XX 10:23:15\] 开始抓取种子网站:neWS.XXX.COm
\[XXXX-XX-XX 10:23:17\] 发现链接:http://neWS.XXX.COm/1.html
\[XXXX-XX-XX 10:23:18\] 抓取成功,大小:4.2KB
\[XXXX-XX-XX 10:23:19\] 发现链接:http://neWS.XXX.COm/2.html
……
记录一直延续到最新一行:抓取网页总数:347。
贾瀞雯看着那串数字,手也开始抖。
“网页内容呢?”她问。
“都存在服务器上了。”李明眼睛发亮,“虽然现在只能存文本,图片还处理不了,但这是第一步!最关键的第一步!”
贾瀞雯放下纸,深深吸了口气。
“叫大家过来。”她说,“我们……庆祝一下。”
五分钟后,六个人挤在小小的会议室里。
桌上摆着几瓶可乐,是贾瀞雯刚才下楼买的。
“同志们。”贾瀞雯举起可乐瓶,“今天,我们抓到了第一批网页。
虽然只有三百多个,虽然还有很多问题要解决,但这是一个开始。”
她顿了顿,声音有些哽咽:“谢谢大家。
谢谢你们的努力。”
李明举起瓶子:“谢谢贾总,谢谢陈总给我们这个机会。”
张涛说:“这才刚开始。
接下来要做索引,要写分词,要搞排名算法……路还长着呢。”
“但至少,”王磊笑着说,“我们知道路怎么走了。”
可乐瓶碰在一起,发出清脆的响声。
那天晚上,贾瀞雯给陈浩打电话。
电话接通时,她能听到陈浩那边有风声,像是在室外。
“浩哥,我们成了。”她说,“爬虫抓到了第一批网页,三百多个。”
电话那头安静了几秒。
然后,陈浩笑了。
那笑声透过电话线传来,温暖而有力。
“太好了。”他说,“告诉他们,干得漂亮。”
“你在哪儿?”贾瀞雯问。
“天台,看星星。”陈浩说,“忽然觉得,我们也在摘星星。
互联网这片星空,我们要摘最亮的那颗。”
贾瀞雯走到窗边,看向北京的夜空。
城市的灯光太亮,看不到星星。
但她知道,他们确实在摘星星。
用代码,用算法,用一群年轻人的热情和一个远见者的梦想。
她握紧手机,轻声说:“我们会摘到的。”
【跪求礼物,免费的为爱发电也行!】