?
Ни о какой безапелляционности в моих высказываниях не может быть и речи! [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

об утечке из фейсбука и моей фамилии [апр. 24, 2021|06:58 pm]
Anatoly Vorobey
[Tags|]

Пару недель назад в публичный доступ попала массивная утечка данных из Фейсбука: имя, фамилия, и номер телефона (плюс еще немного по мелочи, но не содержимое постов или что-то в этом духе) 500 миллионов пользователей - примерно 20% всех пользователей ФБ.

Я скачал быстро файлы по России и Израилю (там большой текстовый файл отдельно для каждой страны) и проверил, кто из семьи-друзей оказался там, а кто нет, просто из любопытства, а потом не знал особо, что с этим делать. Но потом все-таки придумал одну простую вещь. По сути, как кто-то остроумно заметил, эта утечка - первая общемировая телефонная книга, правда, неполная, но все равно, какие-то тренды по именам и фамилиям в ней можно отслеживать, например.

Моя фамилия - Воробей, но я давно привык к тому, что ее часто неправильно пишут Воробьев, потому что Воробьев - намного более частая фамилия, чем Воробей, по причинам, которые мне не вполне понятны. Но как минимум я смог это проверить по этой утечке из фейсбука. И действительно, суммируя по разным написаниям этих фамилий, а также женскому варианту (Воробьева), я посчитал, что кол-во людей с фамилией "Воробей" в этой базе данных из Фейсбука примерно 4% от кол-ва людей с фамилией "Воробьев/а", в 25 раз меньше.

Не сказать, чтоб супер важное исследование или супер полезные данные, но если кому-то нужно что-то такое, то да, это пол-миллиарда имен-фамилий-стран-городов-телефонов.
СсылкаОтветить

Comments:
Страница 1 из 2
<<[1] [2] >>
[User Picture]From: ziavra
2021-04-24 04:05 pm
А где можно скачать файлы?
(Ответить) (Thread)
From: (Anonymous)
2021-04-24 04:16 pm
> Воробьев - намного более частая фамилия, чем Воробей, по причинам, которые мне не вполне понятны.

Фамилии на -ов/-ев образованы типовым для русского языка способом. Поэтому их много.

А фамилия из просто слова, без характерных фамильных окончаний, русскому вообще не свойственны. Это украинский способ образования фамилий, что уже само по себе делает их более редкими, за счет разницы в населении; а поверх еще накладывается то, что в украинском воробья, строго говоря, нет — он горобець. То есть, Воробей — фамилия, образованная украинским способом из не-украинского слова. Ничего удивительного, что она редка.
(Ответить) (Thread)
From: (Anonymous)
2021-04-24 04:24 pm
Кстати. В свете комментария ниже: поскольку Соловей на украинском таки Соловей, то Соловьев должно быть примерно треть от Соловьевых.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: xaxam
2021-04-24 04:20 pm
А какой вывод из этого могут сделать Соловьи/Соловьёвы? помимо частотности фамилий, производных разным способом от слов русского языка?
(Ответить) (Thread)
[User Picture]From: aka_mik
2021-04-24 05:18 pm
Я и без утечек) посчитал, что в нашем киевском филиале только 17% работников - коренные киевляне (контора - одна из крупнейших в стране)
(Ответить) (Thread)
[User Picture]From: darum
2021-04-24 05:24 pm
Логично, города же в основном растут за счёт притока населения, а не роста числа коренных жителей.
(Ответить) (Parent) (Thread)
From: (Anonymous)
2021-04-24 09:13 pm
А ещё бывают Воробьенко и, о ужас, Воробьенковы -- последний способ образования фамилий меня особенно вымораживает.
(Ответить) (Thread)
[User Picture]From: geish_a
2021-04-25 02:36 am
Не говоря уж про Воробьяниновых.
(Ответить) (Parent) (Thread)
[User Picture]From: spartanus
2021-04-24 10:51 pm
Можно глупый вопрос? Чем хорошо смотреть файлы в почти гигабайт размером?..
(Ответить) (Thread)
From: rezkiy
2021-04-24 11:24 pm
vim :-)
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: amigofriend
2021-04-25 07:00 am
Вот кто-то с горочки спустился
Да это ж Толя Воробей
При ём утечка из фейсбука
Она на светв всех милей!
(Ответить) (Thread)
[User Picture]From: alaev
2021-04-29 06:36 am
А за раздачу той утечки
Не огрести б ему люлей!

Это тонкий вопрос — не становится ли соучастником кражи данных тот, кто их распространяет.
(Ответить) (Parent) (Thread)
[User Picture]From: siticen
2021-04-25 07:53 am
Кстати да, раньше выходили всякие справочники типа "Вся Москва за 1913 год", ими еще Лев Успенский пользовался, но они не оцифрованы или криво распознаны. Сейчас же досужим антропонимистам вполне можно пользоваться подобными базами данных (конечно, с известной осторожностью).
(Ответить) (Thread)
[User Picture]From: dent
2021-04-25 08:22 am
если кому-то нужно что-то такое, то да, это пол-миллиарда имен-фамилий-стран-городов-телефонов.

"Операторы сбербанка", и прочие мошенники всех мастей будут рады новой базе доверчивых клиентов!
(Ответить) (Thread)
[User Picture]From: Михаил
2021-04-27 07:43 am
Как будто у них и раньше этой информации не было.
(Ответить) (Parent) (Thread)
[User Picture]From: kray_zemli
2021-04-25 08:57 am
Вот ведь дожили! Когда-то можно было про любого всё бесплатно посмотреть в телефонном справочнике. А теперь, Цукерберг или Дуров знают о вас всё, а попробуй сам начать собирать информацию о Цукерберге или Дурове — где живёт, в какой школе учатся его дети, какой дорогой возвращается домой — сядешь тут же.

Либеральная мразь сделала личную информацию людей своей частной собственностью и внушила дебилам поколения Z, что так и надо. Теперь какой-нибудь банк может свободно торговать сведениями о том, сколько у вас в нём денег. И когда перепродажа этой информации, наконец, докатится уже до последнего жулика, банк будет картинно делать круглые глаза и спирать всё на злобных хакеров. Как Миша Галустян в роли консьержа.

Edited at 2021-04-25 09:03 (UTC)
(Ответить) (Thread)
[User Picture]From: Михаил
2021-04-27 07:44 am
Вряд ли "когда-то" в телефонных справочниках помимо ФИО, телефона и, пожалуй, адреса, публиковалась столь специфичная информация, как "в какой школе учатся дети". Если так подробно про каждого горожанина расписывать, так это пожалуй никаких справочников не напасешься.
(Ответить) (Parent) (Thread) (Развернуть)
From: (Anonymous)
2021-04-25 09:39 am
Кто же при регистрации в соцсетях правду пишет? Имя должно быть вымышленным, аватара - не фотографией, год рождения вымышленным. Вы требовали инфу? Получите.
(Ответить) (Thread)
[User Picture]From: pashick
2021-04-25 09:49 am
По Беларуси файлика нет :)
(Ответить) (Thread)
From: (Anonymous)
2021-04-25 12:09 pm
У моего тестя от рождения была фамилия Воробей, но по призыву 1929 года в РККА он предъявил какую-то там справку, паспортов ведь не было, а писарь посмеялся, мол, не выдумывай, нет такой фамилии и записал Воробьёв.
На всю жизнь.
(Ответить) (Thread)
[User Picture]From: flacoloco
2021-04-25 04:51 pm
Вы наш Джек Спарроу, иными словами
(Ответить) (Thread)
Страница 1 из 2
<<[1] [2] >>