这种情况下,站长很难意识到发生了什么,也可能忽略搜索引擎发来的警告。这个时候对于360搜索团队也是一个考验。
毁掉前世
另外,有些黑客在篡改网页的时候,甚至把域名都做了改变。此时搜索引擎就无法比对该网页的历史信息,也就没有办法判断它相对于历史形态有哪些微笑的改动。
这个时候,我们的系统就只能对新网页和我们历史数据中的网页做智能比对,从而判断它的“前世”是哪个网站。
张向征说。
专业“擦边”
除了这些,团队还要面对在识别过程中那些“擦边”的情况。张向征告诉雷锋网宅客频道:
有些网站本身不是赌博网站,但是也许报道了很多非法“六合彩”的内容。
有些网站有大量的类色情词汇分布,但也可能并不是真正的色情网站。
有些网站备案不太完整,也可能增加系统的不信任。
这些情况也许都会导致系统误判。
对于误判,除了不断改进算法之外,最有效的办法就是人工接受站长反馈。
只要人工审核认为不是真正的黑产,我们都会放开。只要你不是诱导用户去赌博。。。
他说。
尾声
至此,网页篡改的黑产大军,以及和他们“神魔斗法”的搜索团队,硝烟弥漫的战争图景展现在你的面前。
也许,正在看文章的你对于自己的判断力有充足的信心,并不认为自己会被黄赌毒网页引入歧途。但是也许你身边的人,年迈的父母,稚嫩的孩子,都是“黄赌毒”网站最肥美的猎物。
庞大的黑产告诉我们网络世界远不是天堂。而面对危险,埋怨从来无济于事。为网络世界构建秩序的点滴努力,都弥足珍贵。
本文来源:不详 作者:佚名