Semalt: Атактуу Орнотулбаган веб-сайттар

Каалаган маалыматтарды кол менен кырыш үчүн, сиз мыкты программалоо жөндөмүнө ээ болушуңуз керек. Же болбосо, белгилүү бир форматта маалыматтарды окуп, түзүмдөп жана кырдырып салууга багытталган веб-маалыматтарды чыгаруучу куралдарды колдоно аласыз. Бирок, кээ бир веб-сайттар эч нерсеге жарабай калат, демек, алар кыртышка каршы ыкманы колдонушат же өзүлөрүнүн белгилерин такай өзгөртүп турушат. Мисалы, LinkedIn, Alibaba жана Facebook кирүү маалыматтарын талап кылат, CAPTCHAга кирүүнү сунуштайт жана колдонуучулардын коопсуздугун жана купуялуулугун камсыз кылуу үчүн IP даректерин бөгөттөйт.

1. Facebook:

Facebook - дүйнө жүзү боюнча 20 миллиондон ашык жигердүү колдонуучулары бар эң белгилүү социалдык тармактардын бири. Facebookтан жеке маалыматтарды чыгарууну көздөгөн көптөгөн колдонмолор жана маалыматтарды кыркуу программалары бар. Тилекке каршы, көпчүлүк куралдар бизге так жана окула турган маалыматтарды бербейт. Фейсбук спам жасоочуларга жана хакерлерге анын колдонуучулары жөнүндө маалымат чогултууну кыйындатты. Аны Python сыяктуу HTML талдоочунун жардамы менен алууга болот, бирок көпчүлүк веб-усталар жана фрилансерлер Python негиздерин билишпейт. Жакында эле ушул социалдык тармак веб-сайтынан маанилүү маалыматтарды алуу үчүн Facebook кыргычы иштей баштады. Facebook кыргыч менен сиз Facebook колдонуучуларынын ысымдарын жана электрондук почта даректерин гана чогулта аласыз. Бирок сиз терең маалымат чогулткуңуз келсе, бул куралды же башка ушул сыяктуу кыргычты колдоно албайсыз.

2. LinkedIn:

LinkedIn - бул социалдык тармактардын дагы бир веб-сайты, аны кырып салуу мүмкүн эмес. Бирок, бир нече веб-баракчадан маалыматтарды жарым-жартылай чыгарып алсаңыз болот, бирок көпчүлүк маалыматка жетүүгө болбойт. Бир гана маалыматты Link.In коомдук профилинен Import.io же Kimono Labs колдонуп кырып салсаңыз болот. Маркетологдор LinkedInдин күчтүү коопсуздук чаралары болгондуктан, скрепинг кызматтарынан пайдалана алышпайт. Бирок, алар коомдук профилдерди кырып салууга жардам берген Lead Extractor колдонуп башташты. Бул курал профилдеги шилтемелерди, ысымдарды жана электрондук почта даректерин гана кыра алат. Эгер сиз Skype ID, Yahoo Messenger ID, толук дареги жана колдонуучунун Twitter ID'син алгыңыз келсе, LinkedIn буга жол бербейт.

3. Алибаба:

Alibaba - онлайн режиминде бизнестен керектөөчүгө кызмат көрсөтүүчү технологиялык конгломерат. Тилекке каршы, ушул веб-сайттан маалыматты кырып салуунун жолу жок. Amazon жана eBayдан айырмаланып, Alibaba өзүнүн колдонуучулары үчүн өнүмдөрү, сүрөттөрү, сүрөттөмөлөрү жана баалары жөнүндө маалымат алуусун кыйындатты. 2015-жылы Alibaba маалыматтарын оңой эле кырып салган бир катар шаймандар коомчулукка сунушталды. Көпчүлүк куралдар акы төлөнөт жана стартаптардын күткөн нерселерине жооп бербейт. Alibaba дүйнө жүзү боюнча кеңири бизнести жүргүзөт жана сатып алуучуларды берүүчүлөр менен байланыштырат. Ошол эле учурда, бул алардын купуялуулугун камсыз кылат жана эч кимге маалыматты кырып салууга жол бербейт. 2017-жылдын октябрына карата, Alibaba өзүнүн платформасында ай сайын 500 миллион ашуун жигердүү колдонуучуларга ээ. Алибаба булут кирешелеринин өсүшүндө Amazon, Google жана Microsoft сыяктуу ири булут оюнчуларынан да ашып түштү. Ал жабдуучулардын купуялуулугун камсыз кылуу үчүн мыкты стратегияларды ишке ашырып, бир нече секунданын ичинде бардык шектүү IP даректерин бөгөттөп салган.

mass gmail