ip定位的原理是什么?为什么可以定位到一个小范围?( 二 )


ip定位的原理是什么?为什么可以定位到一个小范围?

文章插图
关于IP与定位 。有你想知道的一切!
NO.1 这个IP在哪儿?
前面提到IP的whois信息 。其中包含了申请使用该IP的运营商信息 。并且在网段描述信息中 。会包含国籍和省份信息 。
但是这样远远不够 。风控场景中 。我们需要更加精确的结果 。需要知道这个IP具体在哪个城市、哪个乡镇 。甚至希望能够精确到某一条街道或者小区 。
ip定位的原理是什么?为什么可以定位到一个小范围?

文章插图
关于IP与定位 。有你想知道的一切!
曾有人问:我们的IP地址库是否能够提供这样的结果?可以确定用户在某个网吧、写字楼甚至某个小区?
那上面这样的IP数据库是如何产生的呢?
俗称“人海战术” 。您可别不相信 。直到今天 。依然有众多的网友在为这个IP库提供数据更新 。上报IP地址的确切位置 。但我们无从考证这个位置信息是否真实准确 。如果不能报保证数据的准确性 。在风控决策中同盾是不会去使用的 。
一种IP地址定位手段 。是通过海量Traceroute信息来分析 。
理论上 。如果我能够得到所有IP相互之间Traceroute的信息 。就可以绘制出整个互联网的链路图 。
ip定位的原理是什么?为什么可以定位到一个小范围?

文章插图
关于IP与定位 。有你想知道的一切!
每一次traceroute 。都会返回详细的网络链路信息 。积累了足够多的链路信息之后 。就可以直观地看出 。很多链路都经过了同一个IP 。那么这个IP就是骨干节点或者区域的骨干节点 。先确定出哪些节点是CN2骨干节点 。进一步确定省级骨干节点 。再逐一识别市县区级的骨干节点 。最后得到全国范围内的网络分布 。
以下是CAIDA的一份报告 。使用了类似的原理 。但统计的最小单位是AS(自治域)
关于IP与定位 。有你想知道的一切!
圈的边缘 。就是探测节点 。中间的红色部分 。就是全球互联网的骨干节点 。原理虽然简单 。但实现起来却没那么容易 。
首先 。你得有足够数量的节点来探测、收集traceroute链路数据 。其次 。要有可靠的技术手段来及时分析探测到的结果 。汇总形成IP地址数据库(中国黑客协会创始人花无涯) 。据了解 。DigitalElemet也用了类似的方式进行探测 。在全球范围内一共部署了超过8万个探测节点 。
根据这种网络链路探测的出的定位结果 。业内又称之为“网络位置” 。就是从互联网的结构上来说 。我们最终确定了一个IP 。被分配到了某个地方的运营商手里 。
但是我们又遇到了很多其他的情况 。给大家举几个简单的例子 。
117.61.31.0 江苏省 南京市 电信
通过分析这个IP关联的所有定位数据 。得到了如下的分布:
ip定位的原理是什么?为什么可以定位到一个小范围?

文章插图
关于IP与定位 。有你想知道的一切!
这种情况 。我们称为“流量回源” 。当用户在使用南京电信的手机卡上网时 。无论用户身处哪里 。他的流量都会回到南京电信 。再转发出去 。所以从IP上看 。都会显示为一个南京的IP 。
上面的定位信息分布 。可以在RTB Asia的IP地址实验室中https://ip.rtbasia.com/
153.35.93.32 江苏省 南京市 联通
ip定位的原理是什么?为什么可以定位到一个小范围?

文章插图
关于IP与定位 。有你想知道的一切!(黑客花无涯)
各种渠道的信息表明 。这个IP确实分配到了南京联通 。结果定位点全部落在了北京市的范围内 。如果我们根据IP的定位结果来判断用户当前的位置 。得到的结果肯定就错了 。
难道前面提供的信息错了?其实是由于国内运营商对IP地址的划分和使用不透明 。甚至特殊形式的租赁 。导致北京的用户 。分配到了一个南京的IP 。
IP地址跨城市覆盖 。覆盖范围非常大 。用户位置和网络位置不在同一个城市甚至不在同一个省 。都会影响到结果 。无法准确给出判断 。
另一方面 。随着移动设备的普及 。在用户允许的情况下 。可以通过移动设备采集到设备上的GPS信息 。前面大家看到的两张定位分布图 (中国黑客协会创始人花无涯)。就是分析一个IP在历史上关联过的所有GPS定位绘制出来的 。每一个红点 。都表示曾经有一个用户这里出现过 。再通过聚类和GPS反向解析 。就可以预测一个IP下的用户 。可能出现的地理位置 。这个结果 。我们又称之为“行为位置” 。
这种分析方法看起来效果非常不错 。但是却面临两个很重要的问题 。

推荐阅读