Знает ли Facebook о здоровье своих пользователей?
Как пишет Bloomberg, большие объемы данных в сети пока слабо позволяют вычислять секреты пользователей. Это и успокаивает, и разочаровывает. Сообщения о том, что специалисты могли бы на основании информации в Facebook «предсказывать», что у пользователя проблемы со здоровьем, произвели впечатление, но и огорчили.
Сведения о состоянии здоровья включают такие, что могут поставить в неловкое положение, как инфекции, передаваемые половым путем, связанные с опасностью дискриминации психические расстройства, депрессия, а также беременность. Предполагается, что некоторым людям хотелось бы, чтобы им сообщали подобные новости о них.
Но беспокоиться не стоит. Большой брат на самом деле не знает. Если не обращать внимания на заголовки, реальные научные факты таковы, что исследователи, имеющие доступ к каналам Facebook, могут сделать вывод более точный, чем случайный, но не могут предсказать какую-либо конкретную медицинскую проблему. Сведения в Facebook только по 10 из 21 позиций более информативны, чем обычные демографические данные, такие, как пол, этническая принадлежность и возраст.
Тех, кто обеспокоен проблемой приватности и таинственными щупальцами Facebook, успокоит тот факт, что предсказательные возможности срабатывают только на больших объемах информации.
В исследовании, проведенном учеными из Penn Medicine университета Stony Brook участвовали 999 добровольцев, отобранных из 1700 человек, так как не все представили достаточный объем информации. Исследователи сравнили предположения, основанные на информации волонтеров, выложенной ими в Facebook, с их реальными проблемами со здоровьем в соответствии с медицинскими записями. Результаты опубликованы в прошлом месяце в журнале Plos One.
Предположения основывались на частоте употребления пользователем определенных слов, что было довольно интересно. Предполагалось, что среди людей, употребляющих множество непечатных жаргонных выражений, касающихся секса, могут быть инфекции, передаваемые половым путем. Такая взаимосвязь на самом деле не такой уж большой секрет. Неожиданностью стало то, что люди, часто пишущие слова «Бог», «молиться» более часто страдали диабетом II типа.
Исследователи слишком часто усматривали причинно-следственные связи там, где это казалось маловероятным. Вряд ли упоминание в постах Бога, молитв связано непосредственно с болезнью. Скорее это говорит о связи религиозных традиций с пищевыми, которые, в свою очередь связаны с диабетом II типа. Или же в определенной группе населения по некой причине более принято обсуждать молитвы и диабет.
Почему же новость была представлена как нечто значительное? По одной причине, прогнозирование легко можно сделать впечатляющим или пугающим, сравнивая его с тем, что не очень способно предсказывать. В пресс-релизе один из исследователей хвалился, что их анализ лучше прогнозирует развитие диабета II типа, чем показатель
массы тела, но позже было доказано, что показателю массы тела придавалось слишком большое значение при прогнозировании проблем со здоровьем. В пресс-релизе подчеркивалось, что информация в Facebook дает больше, чем обычные демографические данные, по большей части изучаемых медицинских состояний, но демографические данные и не являются в этом высоким образцом.
Несколько лет назад исследователи проводили нечто подобное. Они сообщали, что Cambridge Analytica могла собирать информацию по каналам Facebook и на ее основе предугадывать результаты индивидуальных тестов пользователей лучше, чем их друзья, и это могло помочь компании в манипулировании аудиторией в политических целях. Как бы ужасно это ни звучало, но друзья не сильны в предсказании подобных результатов. Люди не сильны даже в предсказании своих собственных.
Технология, примененная для изучения проблем со здоровьем, может принести пользу при анализе тенденций в социальном здравоохранении.
«Захватывающим в этом является то, что представлены первые свидетельства о возможности использовать общественные СМИ для прогнозирования заболеваний», - утверждает Син Янг, руководитель университета при Калифорнийском институте технологий прогнозирования. Пока «основные преимущества – у ученых», - добавил он. Метод не будет внедряться как замена ежегодного медосмотра или как основа для стратегии общественного здравоохранения.
Действительность утешительна для нашей приватности, однако не оправдывает надежд тех, кто добивается глубокого проникновения в причины людских болезней. Даже просканировав 20 миллионов слов с помощью продвинутой технологии, ученые не достигли большего, чем они получили бы, используя демографические данные и догадки. Все же помните: чем меньше то, чем вы делитесь, тем меньше они могут вычислить.
Но беспокоиться не стоит. Большой брат на самом деле не знает. Если не обращать внимания на заголовки, реальные научные факты таковы, что исследователи, имеющие доступ к каналам Facebook, могут сделать вывод более точный, чем случайный, но не могут предсказать какую-либо конкретную медицинскую проблему. Сведения в Facebook только по 10 из 21 позиций более информативны, чем обычные демографические данные, такие, как пол, этническая принадлежность и возраст.
Тех, кто обеспокоен проблемой приватности и таинственными щупальцами Facebook, успокоит тот факт, что предсказательные возможности срабатывают только на больших объемах информации.
В исследовании, проведенном учеными из Penn Medicine университета Stony Brook участвовали 999 добровольцев, отобранных из 1700 человек, так как не все представили достаточный объем информации. Исследователи сравнили предположения, основанные на информации волонтеров, выложенной ими в Facebook, с их реальными проблемами со здоровьем в соответствии с медицинскими записями. Результаты опубликованы в прошлом месяце в журнале Plos One.
Предположения основывались на частоте употребления пользователем определенных слов, что было довольно интересно. Предполагалось, что среди людей, употребляющих множество непечатных жаргонных выражений, касающихся секса, могут быть инфекции, передаваемые половым путем. Такая взаимосвязь на самом деле не такой уж большой секрет. Неожиданностью стало то, что люди, часто пишущие слова «Бог», «молиться» более часто страдали диабетом II типа.
Исследователи слишком часто усматривали причинно-следственные связи там, где это казалось маловероятным. Вряд ли упоминание в постах Бога, молитв связано непосредственно с болезнью. Скорее это говорит о связи религиозных традиций с пищевыми, которые, в свою очередь связаны с диабетом II типа. Или же в определенной группе населения по некой причине более принято обсуждать молитвы и диабет.
Почему же новость была представлена как нечто значительное? По одной причине, прогнозирование легко можно сделать впечатляющим или пугающим, сравнивая его с тем, что не очень способно предсказывать. В пресс-релизе один из исследователей хвалился, что их анализ лучше прогнозирует развитие диабета II типа, чем показатель
массы тела, но позже было доказано, что показателю массы тела придавалось слишком большое значение при прогнозировании проблем со здоровьем. В пресс-релизе подчеркивалось, что информация в Facebook дает больше, чем обычные демографические данные, по большей части изучаемых медицинских состояний, но демографические данные и не являются в этом высоким образцом.
Несколько лет назад исследователи проводили нечто подобное. Они сообщали, что Cambridge Analytica могла собирать информацию по каналам Facebook и на ее основе предугадывать результаты индивидуальных тестов пользователей лучше, чем их друзья, и это могло помочь компании в манипулировании аудиторией в политических целях. Как бы ужасно это ни звучало, но друзья не сильны в предсказании подобных результатов. Люди не сильны даже в предсказании своих собственных.
Технология, примененная для изучения проблем со здоровьем, может принести пользу при анализе тенденций в социальном здравоохранении.
«Захватывающим в этом является то, что представлены первые свидетельства о возможности использовать общественные СМИ для прогнозирования заболеваний», - утверждает Син Янг, руководитель университета при Калифорнийском институте технологий прогнозирования. Пока «основные преимущества – у ученых», - добавил он. Метод не будет внедряться как замена ежегодного медосмотра или как основа для стратегии общественного здравоохранения.
Действительность утешительна для нашей приватности, однако не оправдывает надежд тех, кто добивается глубокого проникновения в причины людских болезней. Даже просканировав 20 миллионов слов с помощью продвинутой технологии, ученые не достигли большего, чем они получили бы, используя демографические данные и догадки. Все же помните: чем меньше то, чем вы делитесь, тем меньше они могут вычислить.