竞品分析的艺术——空间测绘扫描策略初探

不管做什么工作，只有明确了你的目标，你才能知道自己到底该做什么。

0x01 背景

作为一个螺（实）丝（习）钉（生），工作内容比较灵活，所以各方面的东西都能接触到不少。这回来唠嗑唠嗑自己对空间测绘系统扫描策略的一些理解。

总感觉今年各家的空间测绘产品都逐渐冒头toC了，除了老牌的Shodan、Censys、Zoomeye、Fofa、BinaryEdge，新晋的如全球鹰、RaySpace、Sumap等产品都陆陆续续开启了toC模式，这说明网络空间测绘在整个国家网络安全方面的需求更加明显了，各家都开始顺势打造并巩固属于自己的产品壁垒。

0x02 从扫描引擎看扫描策略

拿Zmap、Masscan的官方宣传的话来说，默认模式45分钟左右可以扫完全网。但对于空间测绘系统来说，不单单是扫完全网某一端口是否开放就完事了，还需要对开放端口的协议进行识别、甚至还有深度识别，才能绘制出细致的网络空间地图。

所以如果现在基本上很少看到以“多快”能扫描全网这种类似的宣传用语了，毕竟懂的人都懂。

那么在扫描速度受各种因素限制的情况下，怎么样扫，才能达到“类全网”扫描的结果呢？在扫描引擎的角度，除了底层扫描逻辑的优化和设置端口扫描/识别优先级，还能通过什么来优化扫描策略呢？

0x03 从全网IP存活数看扫描策略

在真正接触网络空间测绘之前，用空间测绘产品时都是站在点的角度上去看某个IP下有啥东西。现在慢慢接触了之后，才发现甚至可以站在宏观的角度上，从单位、区域等角度去看整个网络空间的信息，真是让人大开眼界。下面这幅图是全网Ipv4网络空间存活的希尔伯特曲线，可以清晰的看到其实并不是所有IP都是存活的，也就是有些IP是没有被利用的（感兴趣的可以去研究一下这部分没利用的IP都在谁手里，这里就不详细展开了）。
-w557
也就是说，我们可以将全网所有Ipv4的IP分成若干块，然后按照每块的IP利用率进行排序，然后对这些频繁存活的IP块进行周期扫描识别，也就能在消耗相同资源的情况下，完成了“类全网”扫描识别。
但其实这种策略有个缺点就是，利用率低的块可能就不能很好的覆盖扫描。