被識別出的換ip軟件就不是高匿嗎?
怎么判斷代理IP是不是真的高匿? 很多朋友有這樣的觀點,認為用了高匿ip代理就一定不會被反爬識別,反之就是透明ip代理或是普通ip代理,這樣的觀點其實是不正確的,并不是用了髙匿ip代理,就可以完全忽略反爬蟲了,那樣的話,也就沒反爬蟲什么事了。
其實要想識別IP代理軟件的匿名等級并不復雜,只需要通過腳本程序(如ASP PHP JSP等)即可在服務器端識別出來,識別的辦法就是抓數據包里的相關字段:REMOTE_ADDR,HTTP_VIA以及HTTP_X_FORWARDED_FOR。
1、透明ip代理
REMOTE_ADDR = Proxy IP
HTTP_VIA = Proxy IP
HTTP_X_FORWARDED_FOR = Your IP
2、普通ip代理
REMOTE_ADDR = proxy IP
HTTP_VIA = proxy IP
HTTP_X_FORWARDED_FOR = proxy IP
3、高匿ip代理
REMOTE_ADDR = Proxy IP
HTTP_VIA = not determined
HTTP_X_FORWARDED_FOR = not determined
透明ip代理會向目標服務器透露自己的真實IP,普通ip代理會向目標服務器透露用了代理,而髙匿ip代理什么都不會透露給目標服務器。由此可見,用透明代理和普通代理被識別的幾率非常大,只要做好了反爬策略的網站一般都能輕易識別。
使用髙匿ip代理的話,雖不容易被識別,但也不是不可能被識別了。如果觸發了反爬策略依然被識別,被限制,比如訪問頻率,次數,User-Agent,cookies,reprefer等等很多因素,而且反爬策略是會不斷的升級的,相應的爬蟲策略也要不斷的升級才行。動態ip海屬于國內高匿ip代理軟件,線路ip近千萬條,不重復,延時低,是爬蟲用戶順利完成任務的最佳助手。
版權聲明:本文為ipadsl.cn所屬公司原創作品,未經許可,禁止轉載!