Кој собира големи податоци и зошто?

Во есента 2019 година, избувна скандал со услугата Apple Card: при регистрацијата издаваше различни кредитни лимити за мажи и жени. Дури и Стив Возниак немаше среќа:

Една година претходно беше откриено дека платформата Нетфликс на корисниците им прикажува различни постери и тизери, во зависност од нивниот пол, возраст и националност. За ова, службата беше обвинета за расизам.

Конечно, Марк Цукерберг редовно добива прекор за наводно собирање, продавање и манипулирање со податоците на неговите корисници од страна на Фејсбук. Со текот на годините, тој беше обвинет, па дури и суден за манипулации за време на американските избори, помагање на руските специјални служби, поттикнување омраза и радикални ставови, несоодветно рекламирање, протекување податоци од корисниците, попречување на истраги против педофили.

Објава на Фејсбук од Зук

Истовремено, онлајн сервисот Порнхаб годишно објавува извештаи за тоа каков вид порно бараат луѓе од различна националност, пол и возраст. И поради некоја причина ова никому не му пречи. Иако сите овие приказни се слични: во секоја од нив се занимаваме со големи податоци, кои во XNUMX век се нарекуваат „ново масло“.

Што се големи податоци

Големи податоци - тие се исто така големи податоци (eng. Big Data) или метаподатоци - е низа на податоци што пристигнуваат редовно и во големи количини. Тие се собираат, обработуваат и анализираат, што резултира со јасни модели и обрасци.

Впечатлив пример се податоците од Големиот хадронски судирач, кој доаѓа континуирано и во големи количини. Со нивна помош, научниците решаваат многу проблеми.

Но, големите податоци на веб не се само статистика за научни истражувања. Тие можат да се користат за следење како се однесуваат корисниците од различни групи и националности, на што обрнуваат внимание и како комуницираат со содржината. Понекогаш, за ова, податоците не се собираат од еден извор, туку од неколку, споредувајќи и идентификувајќи одредени обрасци.

За тоа колку се важни големите податоци на мрежата, тие почнаа да зборуваат кога имаше навистина многу. На почетокот на 2020 година, во светот имало 4,5 милијарди корисници на Интернет, од кои 3,8 милијарди биле регистрирани на социјалните мрежи.

Кој има пристап до големите податоци

Според анкетите, повеќе од половина од нашите земји веруваат дека нивните податоци на мрежата се користат од трети страни. Во исто време, многумина објавуваат лични информации, фотографии, па дури и телефонски број на социјалните мрежи и апликации.

Тука треба да се објасни: првата личност е самиот корисник, кој ги поставува своите податоци на кој било ресурс или апликација. Во исто време, тој се согласува (става штиклирање во договорот) за обработка на овие податоци втора страна – односно сопствениците на ресурсот. Трета страна е оние на кои сопствениците на ресурсот можат да префрлаат или продаваат кориснички податоци. Често тоа е напишано во корисничкиот договор, но не секогаш.

Третата страна се владини агенции, хакери или компании кои купуваат податоци за комерцијални цели. Првиот може да добие податоци со одлука на суд или повисок орган. Хакерите, се разбира, не користат никакви дозволи - тие едноставно ги хакираат базите на податоци зачувани на серверите. Компаниите (со закон) можат да пристапат до податоците само ако вие самите сте им дозволиле – со штиклирање на полето според договорот. Во спротивно, тоа е незаконски.

Зошто компаниите користат големи податоци?

Големите податоци во комерцијалната област се користат со децении, едноставно не беа толку интензивни како што е сега. Тоа се, на пример, записи од камери за надзор, податоци од GPS навигатори или онлајн плаќања. Сега, со развојот на социјалните мрежи, онлајн услугите и апликациите, сето ова може да се поврзе и да се добие најкомплетната слика: каде живеат потенцијалните клиенти, што сакаат да гледаат, каде одат на одмор и каква марка на автомобил имаат.

Од горенаведените примери, јасно е дека со помош на големи податоци, компаниите, пред сè, сакаат да таргетираат реклами. Односно, да се понудат производи, услуги или индивидуални опции само на вистинската публика, па дури и да се прилагоди производот за одреден корисник. Освен тоа, рекламирањето на Facebook и другите големи платформи станува се поскапо, а прикажувањето на сите по ред не е нималку профитабилно.

Информациите за потенцијалните клиенти од отворени извори активно ги користат осигурителните компании, приватните клиники и работодавците. Првиот, на пример, може да ги промени условите за осигурување ако видат дека често барате информации за одредени болести или лекови, а работодавците можат да проценат дали сте склони кон конфликти и асоцијално однесување.

Но, постои уште една важна задача со која се мачи во последниве години: да се доближиме до најспособната публика. Ова не е толку лесно да се направи, иако задачата е значително олеснета со платежни услуги и електронски проверки преку единствен OFD (оператор за фискални податоци). Со цел да се приближат што е можно повеќе, компаниите дури се обидуваат да ги пронајдат и „негуваат“ потенцијалните клиенти уште од детството.: преку онлајн игри, интерактивни играчки и едукативни услуги.

Како работи?

Најголемите можности за собирање податоци се од глобалните корпорации кои поседуваат неколку услуги одеднаш. Фејсбук сега има повеќе од 2,5 милијарди активни корисници. Во исто време, компанијата поседува и други услуги: Instagram – повеќе од 1 милијарда, WhatsApp – повеќе од 2 милијарди и други.

Но, Google има уште поголемо влијание: Gmail го користат 1,5 милијарди луѓе во светот, уште 2,5 милијарди од мобилниот оперативен систем Android, повеќе од 2 милијарди од YouTube. И тоа не ги смета апликациите за пребарување на Google и Google Maps, продавницата на Google Play и прелистувачот Chrome. Останува да ја прицврстите вашата онлајн банка - и Google ќе може да знае буквално сè за вас. Патем, Yandex е веќе чекор понапред во овој поглед, но ја покрива само публиката што зборува руски.

???? Како прво, компаниите се заинтересирани за тоа што објавуваме и сакаме на социјалните мрежи. На пример, ако банката види дека сте во брак и активно ви се допаѓаат девојки на Инстаграм или Тиндер, поголема е веројатноста да одобрите потрошувачки кредит. И хипотеката на семејството ја нема.

Исто така, важно е на какви реклами ќе кликнете, колку често и со каков резултат.

(Т.е. Следниот чекор се приватни пораки: тие содржат многу повеќе информации. Протекоа пораки на VKontakte, Facebook, WhatsApp и други инстант-месинџери. Според нив, патем, лесно е да се следи геолокацијата во моментот на испраќање на пораката. Сигурно сте забележале: кога разговарате за купување нешто или само нарачување пица со некого, релевантното рекламирање веднаш се појавува во доводот.

🚕 Големите податоци активно се користат и „протекуваат“ од услугите за испорака и такси. Знаат каде живеете и работите, што сакате, колкав е вашиот приближен приход. Uber, на пример, ја покажува цената повисока ако возите дома од барот и очигледно претерате. А кога имаш куп други агрегатори на телефонот, напротив ќе понудат поевтини.

(Т.е. Постојат услуги кои користат фотографии и видеа за да соберат што е можно повеќе информации. На пример, библиотеки за компјутерска визија - Google има една. Тие ве скенираат вас и вашата околина за да видат каква големина или висина сте, какви марки носите, каков автомобил возите, дали имате деца или домашни миленици.

(Т.е. Оние кои обезбедуваат СМС порти до банките за нивните пораки, можат да ги следат вашите купувања на картичката – знаејќи ги последните 4 цифри и телефонски број – и потоа продадете ги овие податоци на некој друг. Оттука и целиот овој спам со попусти и пица како подарок.

🤷️️ Конечно, ние самите ги пропуштаме нашите податоци на левите сервиси и апликации. Запомнете ја таа возбуда околу Getcontact, кога сите беа среќни да го пополнат својот телефонски број за да дознаат како го напишале другите. И сега пронајдете го нивниот договор и прочитајте што пишува за преносот на вашите податоци (спојлер: сопствениците можат да ги префрлат на трети лица по нивна дискреција):

Корпорациите можат успешно да собираат, па дури и да продаваат кориснички податоци со години, додека не дојде до тужба – како што се случи со истиот Facebook. А потоа одлучувачка улога одигра прекршувањето на GDPR од страна на компанијата – закон во ЕУ кој ја ограничува употребата на податоци многу построго од американскиот. Друг неодамнешен пример е скандалот со антивирусот Avast: една од подружниците на компанијата собирала и продавала податоци од 100 до 400 милиони корисници.

Но, дали сето ова има некакви предности за нас?

Колку големите податоци ни помагаат на сите нас?

Да, има и светла страна.

Големите податоци помагаат да се фатат криминалци и да се спречат терористички напади, да се пронајдат исчезнати деца и да се заштитат од опасност.

Со нивна помош ние добиваме одлични понуди од банки и лични попусти. Благодарение на нив ние не плаќаме за многу услуги и социјални мрежи кои заработуваат само на реклами. Во спротивно, само Инстаграм би не чинел неколку илјади долари месечно.

Само Фејсбук има 2,4 милијарди активни корисници. Во исто време, нивниот профит за 2019 година изнесува 18,5 милијарди долари. Излегува дека компанијата заработува до 7,7 долари годишно од секој корисник преку рекламирање.

Конечно, понекогаш е едноставно погодно: кога службите веќе знаат каде сте и што сакате, а вие не треба сами да ги барате информациите што ви се потребни.

Друга перспективна област за примена на Big Data е образованието.

Во еден од американските универзитети во Вирџинија беше спроведена студија за собирање податоци за студенти од таканаречената ризична група. Тоа се оние кои учат слабо, ги пропуштаат часовите и се пред отпаѓање. Факт е дека во државите секоја година се одбиваат околу 400 луѓе. Ова е лошо и за универзитетите, на кои им е намален рејтингот и им се скрати финансирањето, и за самите студенти: многумина земаат заеми за образование, кои, по одбивањето, сепак ќе треба да се вратат. Да не зборуваме за изгубеното време и изгледите за кариера. Со помош на големи податоци, можно е на време да се идентификуваат заостанатите и да им се понуди учител, дополнителни часови и друга насочена помош.

Ова, инаку, е погодно и за училиштата: тогаш системот ќе ги извести наставниците и родителите - велат, детето има проблеми, ајде да му помогнеме заедно. Големите податоци исто така ќе ви помогнат да разберете кои учебници работат подобро и кои наставници полесно го објаснуваат материјалот.

Друг позитивен пример е профилирањето на кариерата.: тоа е кога на тинејџерите им се помага да се одлучат за својата идна професија. Овде, големите податоци ви овозможуваат да собирате информации што не можат да се добијат со помош на традиционални тестови: како се однесува корисникот, на што обрнува внимание, како комуницира со содржината.

Во истите САД, постои програма за кариерно насочување – SC ACCELERATE. Тој, меѓу другото, користи CareerChoice GPS технологија: тие анализираат податоци за природата на учениците, нивните склоности кон предметите, силните и слабите страни. Податоците потоа се користат за да им се помогне на тинејџерите да ги изберат вистинските факултети за нив.

Претплатете се и следете не на Yandex.Zen — технологија, иновации, економија, образование и споделување во еден канал.

Оставете Одговор