Tag Archives: data

Прогрессивная преступность

Future Crimes: Everything Is Connected, Everyone Is Vulnerable and What We Can Do About It

Пора завязывать с покупкой обзорных книжек про то, как меняется мир под солнечным ветром новых технологий, – сказала я пять таких книжек назад. Мне всегда кажется, что в очередной “Как бигдатой геймифицировать сингулярность, не привлекая внимания санитаров” я найду какой-то новый для меня тезис, ход мысли конем, но нет.

Вот и Future Crimes. Заход хороший: бывший сотрудник органов и ныне кто-то там в стартапах решил описать новое лицо преступности. Я думала, там будет описание сайбер-злодейств, с которыми автор сталкивался лично, на деле же – компиляция известных кейсов и общих сведений о фишинге, мошенничествах разных видов, взломе систем, краже личных данных и так далее. Бонусом идет описание возможностей новых технологий типа интернета вещей – взломанный холодильник сможет так ловко хлопнуть дверцей, что обезглавит владельца.

По иронии судьбы автор составил настоящий справочник профориентации начинающих киберпреступников. Он так хорошо описал основные варианты не вполне добросовестного использования технологий, что книжку можно запросто переделать в майндмэп или тест, по которому можно будет выбрать подходящий киберкрайм – по уровню нужных технических навыков, по степени жестокости, по уровню дохода и оценочному риску. Понятно же, что быть high frequency trader, который пользуется своим преимуществом в вычислительной мощности и скорости канала, чтобы отслеживать чужие запросы на покупку, перекупать активы у них под носом и тут же перепродавать чуть дороже – это одно. Похитить у правительства массив медицинской информации о военных и требовать выкуп за нераспространение – другое, а выслеживать через социальные сети, кто уехал в длинный отпуск, чтобы грабить потом их дома – совсем другое. В книжке нет готовых рецептов, но есть отчетливые указания, где их искать. С ценниками!

Есть даже идеи криминальных стартапов: вот в Лондоне, например, предприимчивая дама создала Убер для преступников, можно в любой момент найти тачку с водителем, который не смотрит в зеркало заднего вида. Crime as a Service (Caas) – перспективная бизнес-модель. Поскольку интернет окончательно обезличивает жертву, решение о преступлении дается легко. Скачать чужую книжку – легко, разослать спам – легко, залезть в чужой почтовый ящик или аккаунт – легко, а после первых моральных компромиссов переход на темную сторону делается все мягче и мягче. Вон, хороший парнень, владелец легендарного Silk Road, заказал же пытки и убийство сисадмина, который тырил у него деньги. В компьютерной игре все легко. Компьютерная игра, где вместо очков – настоящие деньги, хороша особенно.

То, что сайберкрайм распространен настолько, наскоклько он распространен, я могу объяснить только тотальной ленью и инертностью людей. Большинству лень экран протереть, через пыль на фэйсбук смотрят, куда уж там в подробностях взлома разбираться.

 

Если вернуться к началу и попытаться вспомнить околотехнические книжки, в которых все-таки есть мысль, то это будет

Traffic: Why We Drive the Way We Do (and What It Says About Us)

Я писала об этой книжке еще в ЖЖ, там много нетривиальных мыслей о том, что получается, когда миллион высших приматов принимаются разгонять твердые тяжелые предметы до ненормальных для своего восприятия скоростей и делают это все в одном месте. По ИТ-части там тоже есть отличнейшие главы, которые стоит почитать. Книга вышла на русском языке, после чего, я уверена, урбанисты растащили ее по своим концепциям и презентациям.

Reality Is Broken: Why Games Make Us Better and How They Can Change the World

Тоже хорошая книжка про технологии, которая дает рабочую модель объяснения, какие особенности человеческой психики вредят своему же носителю, делая бессмысленную и даже не слишком интересную игру в телефоне субъективно приоритетней рабочих задач. Старенькая уже работа, предмет которой – геймификация – уже успел выйти из моды, а все равно стоит почитать.

Вся королевская биг дать

The Victory Lab: The Secret Science of Winning Campaigns

После двух победоносных кампаний Обамы возник великий миф о технологичных выборах. Обама действительно здорово работал со своим контингентом через интернет, на голову обходя соперников.  Об этом много всего написано: здесь есть мой отзыв на неплохую книжку Yes We Did! An inside look at how social media built the Obama brand

здесь – моя заметка об обамовском же проекте Нарвал и подробней про Нарвал с примерами.

The Victory Lab: The Secret Science of Winning Campaigns – это длинный и спокойный разбор, как американские “менеджеры кампаний” (в отечественной традиции принят термин “политтехнологи”) постепенно дошли до современных подходов, предусматривающих глубокую работу с данными об избирателях. Заодно получился краткий обзор эволюции избирательных технологий. Освежающе-приятно читать книжку, написанную не с привычной “компьютерной” позиции превосходства над ламповым аналоговым миром. Айтишники всегда чувствуют себя миссионерами, несущими дикарям свет истины. Мило, но зачастую дикарями оказываются сами миссионеры.

В одном малькольм-гладуллском труде развивается мысль о глубоком различии между “культурой риса” и “культурой пшеницы”, которое порождает, в частности, видимое преимущество китайцев в современной большой математике (не спрашивайте. Я тоже думаю, что китайские математики сейчас так заметны на научной сцене по чисто математической причине – их много). Так вот, Гладуэлл пишет, что столетия культивирования пшеницы взращивают определенный паттерн: размашисто поработать несколько недель, стремясь обработать большую площадь, перерыв, отчаянная борьба за урожай, длинная бездельная зима. Он даже приводит исторические свидетельства того, что европейские крестьяне впадали в зимнюю спячку – проводили дни в полудреме, тесно прибившись друг к другу, чтобы не тратить зря калории. Другое дело – выращивание риса! 360 дней в году нужно встать до рассвета и вручную проделать серию сложных, предопределенных технологией операций над каждым кустиком. В результате имеем вшитую в культуру дисциплинированность и точность.

Теория пшеницы и риса представляет собой веселое вранье, фоменковщину от социальных наук, но от аналогий трудно удержаться. Избирательная культура в США – это производная от бейсбола и комивояжеров. Российские выборы уходят корнями в эээ… субботники? комсомольскую и партийную работу КПСС? Главная же особенность нашей ситуации в том, что современным выборам в России – двадцать пять лет, первые кампании были гениальной местами кустарщиной от комсоргов (да-да-нет-да), до сих пор не полностью сменилось первое поколение тех, кто работал еще при Ельцине. Не накопили еще плодородный слой.

Я люблю выборы! Это как большой спорт, почти бескровная война и игра в казаки-разбойники одновременно. Не знаю, есть ли еще у взрослого человека возможность сыграть в настолько увлекательную игру. Также не бывает в нормальной жизни, в бизнесе, чтобы мир четко поделился на своих и чужих, чтобы ресурсы лились ниоткуда, и их было много, по-настоящему много, ради результата можно было делать все, существовала конечная дата, после которой все закончится победой или поражением. Отсюда и вся стилистика игры “Зарница” с штабами, секретностью, шпионажем, шифровками, тайными сходками. Видит бог, я хочу еще раз поучаствовать в большой кампании.

Если судить по книжкам и фильмам, за океаном они тоже играют в “Зарницу”. И охмуряют кандидатов. И долгое время любая кампания заканчивалась ровно на следующий день после голосования, зачастую даже без попытки понять, а почему мы победили или проиграли – все были слишком заняты ликвидацией штаба и разъездом по домам. Но, поскольку у американцев было больше времени поиграть в эту игру, они уже успели оформить ремесло в индустрию и поставить вопрос о том, что, собственно говоря, работает, какова цена голоса и как оценивать ROI по каждому инструменту.

Я видела это много раз*: ночь (по неясным для меня причинам (возможно, мальчишеская любовь к романтике, помноженная на привычку спать до двух дня) руководители кампаний любят ночные сходки), штаб, сизый дым, руководитель кампании щурит глаза и говорит что-то вроде: “Весь подготовительный этап мы концентрируемся на наружной рекламе, буквально захватываем пространство. А в последнюю неделю пускаем концентрированную телевизионную рекламу, выскакиваем из каждого утюга! Так мы выведем наших избирателей к урнам”. Ни одна душа не спросит: а почему, собственно говоря, так? Почему это сработает? Может, наоборот, сначала телек, потом наружка? Или вообще ну его этот телек, давайте все выльем в радио? Если спросит, то политтехнолог ответ: “Я провел шестьдесят кампаний, из них 58 – победных. Я знаю. А вы не понимаете логики происходящего”. И это еще неплохой вариант. Плохой вариант – общий многочасовой спор об оттенке синего цвета, который пойдет фоном на щиты. Оттенок все равно потеряется из-за плохой цветокоррекции. А на щитах будет лесок, колосок, мрачный кандидат и подпись типа “Он пройдет и не проведет”.

У зарубежных коллег было ровно все тоже самое, и сейчас есть, потому что выборы – такое удобное дело, что ничего нельзя гарантировать, если умеешь охмурять кандидата и доходчиво объяснять, почему мы проиграли, но все равно по-своему победили, то все будет ок. Ходят, конечно, мрачные легенды о политтехнологах, которые были недостаточно убедительны, и злопамятных кандидатах… У всех нас есть знакомые, решившие резко сменить климат, и у всех нас есть знакомые, рано нашедшие свой последний приют – автокатострофа, пьяный водитель, темный переулок, сердце.

В общем, американцы успели задуматься о методах оценки разных избирательных инструментов, и начали заниматься этим во времена никсоновских кампаний. Компьютеров еще толком не было, а они уже собирали данные и делали то, что сейчас называется микротаргетингом.

На самом деле, все началось с микротаргетинга. Когда-то, в золотые времена демократии, кандидаты честно объезжали своих избирателей, выступали в амбарах и на заводах, говорили с фермерами о земельном налоге, а с рабочими – об импорте машин, и это был микротаргетинг. Потом – бум – большое телевидение и изобретение теледебатов, повсеместное распространение домашних телефонов,. Кандидатам понравилась идея меньше проводить времени в непосредственном общении с электоратом, а менеджерам кампаний стало совсем хорошо – они не только сократили свое собственное пребывание в амбарах и на заводах, но и начали строить кампании на больших закупках услуг у сторонних поставщиков: эфир, полосы в газетах, обзвон избирателей, рассылка писем. А где закупки, там и, эгмс, личное обогащение.

Снаряд против брони, закупки против контроля – работа с данными понадобилась даже не для того, чтобы манипулировать избирателями, а для оптимизации затрат. В этот момент развернулась эпическая война гиков против гуру. Одни опираются на цифры, другие – на опыт и авторитет. В книжке описывается замечательная история, когда каждую неделю по штабу рассылались три варианта письма с предложением оценить их эффективность. Потом предположения гуру сравнивались с реальными показателями. Ни один из опытных политтехнологов не выдавал стабильную точную оценку.

Штаб Ромни на губернаторских выборах выкупил все данные по избирателям у Acxiom, тщательно перетряхнул их и выявил, что потенциальные избиратели клиента – небедные жители хороших районов – смотрят кабельное ТВ и HBO, в частности. Большую часть бюджета на ТВ-рекламу они влили в HBO, получив свой охват. У Обамы есть еще более изощренная история с алгоритмическим составлением списков самых дешевых тайм-слотов в телевезионной сетке, имеющих максимальный охват по его аудитории и выкупа. В первой кампании Обамы они разбили базу для телефонного обзвона на десять частей и для каждой из них наняли по конторе, специализирующейся на обзвоне. Каждую неделю вендор, показывающий худшие результаты, терял контракт. Growth Haking.

Финал книги описывает, как один из главных энтузиастов движения “за data-driven кампании” уходит из больших выборов и принимается за менее благодарную работу: вырабатывает инструменты для повышения общей явки на избирательные участки. Когда и какие письма нужно рассылать людям, чтобы они зарегистрировались и проголосовали? Как убедить их участвовать в демократическом волеизъявлении? Списки позора – тех, кто ленится голосовать, или почетные списки ответственных граждан? Другой мир.

Бонус: база данных всех ТВ-роликов кандидатов в Президенты США с 1952 до 2012 гг. Потрясающе.

___________________________________

* пример вымышлен.

В сложном квесте явись жених невесте

Data, A Love Story: How I Cracked the Online Dating Code to Meet My Match by Amy Webb

Возможно, вы читали статью Эми Вебб или смотрели ее выступление на TED. История такая: девушка искала себе мужа через сервисы он-лайн дейтинга типа Match.com и чуть не спилась, встречаясь в баре с разными странными персонажами. Почему все кандидаты оказываются уродами? Почему высокие красивые доктора и юристы не зовут на свидания?


Дальше начинается собственно история, обещанная в заголовке книжки. Эми составляет список необходимых аттрибутов будущего мужа (72 пункта), разбивает их на две группы и присваивает каждому пункту определенное количество баллов. Личная встреча возможна, только если кандидат набирает 700 баллов по итогам предварительной оценки. Продолжение свиданий – только с мужчинами на 1500 баллов.

Я предполагала, что “Cracked the Online Dating Code” подразумевает, что автор устроила дейтинг-дата-майнинг: скрипт автоматически выделяет перспективных кандидатов, распознает фотографии и выходит на их профайлы в социальных сетях, отсеивает врунов, женатых и состоящих в отношениях, неграмотных, больных и идиотов. На кандидатов из шот-листа можно купить расширенные пакеты данных у data-брокеров и узнать о них совсем уже все. Через несколько недель система выдает Эми досье идеального для нее мужчины и сценарий захвата цели: нужные цитаты, культурные коды, запахи, еда и все такое.

На самом деле, там не так много хайтека, и сам поиск шел вручную. Любой разумный человек и без сложных таблиц с цветовым кодированием сделал бы тоже самое, что сделала, в конечном итоге, Эми. А именно, прекратил бы контактировать с малопривлекательными персонажами и прокачал бы свою анкету – красивые свежие фотографии, нормальное описание. Но с таблицами интересней, что уж там. Важно быть собой – хочется искать мужа, составляя списки и таблицы, значит, нужно поступать именно так. Тем более, что найденный, в итоге, идеальный муж, пришел в восторг, когда увидел всю эту машинерию.

Среди моих дальних знакомых есть женщина, которая уже лет пятнадцать назад реализовала эту стратегию: составила список качеств будущего мужа и просеяла через него несколько тысяч кандидатов. Хорошо настроенный список позволяет организовать “воронку дейтинга”, которая отбрасывает 90% неподходящих кандидатов сразу. Сейчас эта дама живет в счастливом браке с найденным таким образом человеком, растят детей.

Лучший кусочек книги – это когда Эми приходит к психотерапевту с двумя одинаковыми папками, забитыми предельно ясными таблицами и графиками, содержащими все нужные данные. У автора случались панические атаки, она хотела избавиться от них, поэтому на первую же встречу с терапевтом принесла график инциндентов, информацию об условиях возникновения атак, другие важные сведения. По-моему, все правильно. Я бы тоже так сделала, зачем тратить двести долларов на вежливый разговор и “знакомство”. И что сделала терапевт? Чуть ли не покрутила пальцем у виска. Гикам нужны отдельные психотерапевты.

Итог: читать не надо, достаточно посмотреть выступление на TED и порадоваться за человека.