Статистика: обработка данных и толкования
«…оптимизатор аналитического склада ума» © АиП, No.214-РВ
Задали мне тут интересный вопрос - а зачем, собственно, я подписана на рассылку “Глас Рунета“? Вдаваться в историю и вспоминать, почему же лет 7 назад я вообще подписалась на эту рассылку не интересно, и не вспомню точно всех причин. С тех пор многое изменилось, поменялись интересы и цели, нет больше редактора Библиотеки Сайтостроительства; однако не отписываюсь от рассылки прежде всего потому, что лениво (это самый простой ответ). Есть и более сложный - мне в самом деле интересно, кто и на какую тему заказывает массовые опросы у Гласа? Кто, чем и зачем интересуется тенденциями, настроением, платежеспособностью в той или иной отрасли, как изменяется аудитория интернет-пользователей и прочее, прочее? В некоторых опросах принимаю участие, на некоторые с нетерпением жду обработанных результатов (вот таких, к примеру). Помните, я писала о любопытном опросе в конце прошлого года о социальных сетях, и даже попробовала сделать свои какие-то, вполне может быть ошибочные выводы (на основании только вопросов, не статистики)? Пост «Subscribe.ru и социальные сети (разведка)». Вчера пришли результаты этого опроса, сами по себе тоже достаточно любопытные.
Помните уже бородатый анекдот о том, что «в опросе об уровне интернетизации населения на вопрос, опубликованный на сайте васяпупкин.ком “Пользуетесь ли вы интернетом” 100% респондентов ответили утвердительно»? В современных опросниках подобная же ошибка встречается не так уж редко.
В последнее время широкую известность среди пользователей Рунета приобрели социальные сети. “Глас Рунета” посвятил этому прогрессирующему онлайн-сервису специальный опрос, в котором приняли участие более 2000 активных пользователей Рунета, в том числе, 86% проживающих в России и 14% за рубежом.
Абсолютное большинство (66%) опрошенных знают о существовании в Интернете социальных сетей и пользуются их возможностями. Причем наибольшую известность и распространение данный сервис приобрел среди жителей Москвы и Санкт-Петербурга, Северо-Западного, Приволжского и Южного федеральных округов. Среди тех, кто знает о существовании социальных сетей, лишь 10% не пользуются ими.
Среди тех пользователей Рунета, кто пользуется социальными сетями, наиболее популярными ресурсами являются Одноклассники (74%), Мой мир (40%), Вконтакте (37%), Мой круг (27%), Rambler Планета (24%), LovePlanet (22%). На долю прочих сайтов, позиционирующих себя как социальные сети, приходится 10-20% пользователей Рунета посещающих такие ресурсы.
Около 25% респондентов среди тех, кто пользуется социальными сетями, в течение недели ежедневно не более одного часа времени уделяют этому занятию. В целом же, продолжительность пользования социальными сетями в рабочие (учебные) дни несколько ниже, чем в нерабочие (выходные) дни.Сколько примерно времени (часов в день) Вы проводите на сайтах социальных сетей?
в рабочие дни в выходные дни Не посещаю 9,4% 13,1% Не более 1 часа 52,6% 39,5% От 1 до 3 часов 21,8% 27,1% Более 3 часов 6,9% 11,7% Затрудняюсь ответить 9,4% 8,6% В то же время, степень вовлеченности пользователей Рунета в работу онлайн-сообществ, формирующихся внутри социальных сетей, остается невысоким. Около 20% респондентов, среди посещающих сайты социальных сетей, указали, что не состоят ни в одном из сетевых сообществ и не создавали таких сообществ сами. Около 45% состоят не более, чем в десяти онлайн-сообществах, но самостоятельно таких сообществ не создавали. Около 10% создали хотя бы одно сетевое сообщество, а 5% более одного. Примерно у 41% респондентов, среди посещающих сайты социальных сетей, список друзей насчитывает не более десяти человек, у 20% он включает 11-20 человек, у 15% - 21-40 человек, у 15% - более 40 человек.
Такая низкая степень вовлеченности в сетевые сообщества может быть вызвана тем, что для большинства пользователей Рунета социальные сети - это инструмент для поиска старых друзей и знакомых (75%), а также удобный способ общаться с друзьями и знакомыми (74%). Лишь 43% респондентов рассматривают социальные сети как способ узнать мнения различных людей по каким-либо вопросам, а 38% - как инструмент для поиска людей со схожими интересами.
Характеризуя особенности своего участия в социальных сетях, большинство (81%) опрошенных указали, что не являются активными создателями и модераторами онлайн-сообществ (групп), не ведут регулярно личный блог (75%), не стремятся зарабатывать репутацию, особый статус в онлайн-сообществах (68%) и не общаются в реальной жизни с людьми, с которыми познакомились в социальной сети (64%).
Только 20% респондентов, участвующих в социальной сети, стремятся к активному общению со многими людьми, участию в коллективных дискуссиях, в то время как 43% предпочитают просматривать, читать чужие записи на форумах, в блогах, не участвуя в обсуждении. Предпочтительными темами для общения пользователей Рунета в сообществах социальных сетей выступают музыка, кино, книги, игры (51%), компьютеры, программное обеспечение (47%), Интернет (44%), фотографии (37%), любовь и отношения (34%), путешествия (29%).
При регистрации в социальных сетях почти все пользователи Рунета указывают в профиле участника сети свои имя и фамилию (93%), возраст (93%). Несколько реже указываются место учебы или работы (73%), персональный сайт, email, ICQ (70%). Только 68% участников социальных сетей размещают в них личное фото, 58% указывают список друзей, а 55% - свои личные интересы. Лишь каждый четвертый сообщает свой настоящий адрес проживания и номер телефона.
Каждая из существующих социальных сетей обладает набором функций, в числе которых мы предложили респондентам указать три наиболее важные. В результате оказалось, что самыми значимыми функциями социальных сетей являются возможность отправки личных сообщений (77%) и поиск людей по заданному профилю (52%). Некоторой популярностью пользуются функции добавления новых друзей (42%), заполнение и редактирование страницы с личной информацией (26%), общение в форумах и онлайн-конференциях (23%), размещение изображений в фотоальбоме (23%).
А теперь посмотрите на секундочку: сам же Глас и указывает на известную статистику, что “Только 20% респондентов, участвующих в социальной сети, стремятся к активному общению со многими людьми, участию в коллективных дискуссиях, в то время как 43% предпочитают просматривать, читать чужие записи на форумах, в блогах, не участвуя в обсуждении.“; теперь представим срез аудитории, по которым получены данные. Мало того, что это те рунетовцы, которые подписаны на ЭТУ рассылку, так они ещё и заполнили опрос и (опять же цитируя Глас) это “2000 активных пользователей Рунета”. Раз они активны до такой степени, что не поленились подписаться на рассылку, заполнить анкету - какова будет вероятность того, что и в социальных сетях, если (и где) они зарегестрированы, они так же будут представлять из себя на сколько-то там процентов более активную аудиторию, чем весь остальной рунет или даже соц-рунет. Т.е. результат опроса уже построен по ответам очень не типичных интернет-пользователей. Что тогда говорить о выводах в целом?
Вообще я не ругаю Глас, ни в коем случае, данные в любом случае интересные и дают как минимум приблизительный порядок распределения по интересам, по сервисам, по готовности юзеров и т.д. Обидно другое. Как раз ответы на вопросы, так заинтересовавшие меня и не только меня в самом исходном вопросе, в результатах освещены и не были («“Станете ли Вы участником социальной сети на Subscribe.Ru если найдете в ней интересный Вам круг общения и хорошие технические возможности?“, “Какими возможностями социальная сеть на Subscribe.Ru должна обладать в первую очередь?”»). Шифруются. Ну да ладно.
Как часто мы делаем неверные выводы, основываясь на недостаточных или вообще не тех исходных данных… Как часто мы даже не можем сформулировать - какие же данные мы должны обрабатывать и куда смотреть. И ладно, если нет реальной возможности их получить (мало ли… универсальные достоверные и достаточного объёма ответы на вопросы - такой опросник будет дорого стоить, или, к примеру, не хватает технических мощностей даже для сбора (имеющейся в большом объёме) и обработки информации) - есть и цифры, и ресурсы, мы просто не знали, что туда нужно посмотреть. Приведу один пример, он, может, и не типичный, но в духе сегодняшней заметки, это точно.
Жалуется человек, что в статистике (google analytics) посещений своего блога (автономный) наблюдает не ожидаемо высокий процент “Показатель отказов” (раздел “Тенденции посетителей”) с первой же входной страницы. До обидного просто высокий. В некоторые дни прыгает до 84,62 % - что ж это такое-то? Блог чувак ведёт интересный, посты сплошь авторские, к манимейкерству или seo-smo отношения не имеет (ни продажных ссылок, ни баннеров), отвёрстан шаблон блога близко к совершенству (ибо автор - веб-разработчик), дизайн вполне достойный, размещён блог на хорошем непадучем хостинге… Ок, садимся, смотрим его гугл аналитику… И вот что находится:
- Пишет чел о веб-разработке, и, хоть и пишет он на русском исключительно, процент нормальных русских слов в текстах ха-ха не такой уж и высокий - не матерный, нет, сплошные техно-термины, программерские определения, обзоры гаджетов для гиков. Соответственно в статистике ключевых слов (раздел “Источники траффика”) большая часть заходов именно по таким вот названиям тех же гаджетов, по определениям, по терминам
- В разделе “Посетители” -> “Языки” есть волшебная табличка, где публикуется не только данные по “языкам, установленным в настройках браузера пользователей” (там если установлено несколько языков, в табличке так и публикуется, не просто “ru” или “ua”, а, к примеру, “uk-ua”), но и процент отказов по каждой языковой позиции.
Вот там-то и нашли мы данные, влияющие на общую статистику по процентам отказов! У человека в самом деле обнаружилось много заходов со 100%-ми (!) отказами по языковым зонам “ar-sa”, “bg”, “cs”, “it”, “lt”, “nl”, “pt-br”, “uk”, “zh-cn”, а из “en-us” - 82% отказов. Т.е. люди находили блог по англоязычным терминам, востребованным в мировой IT среде, видели, что грузится какая-то фигня с непонятной кириллицей и закрывали документ. В качестве лечения предложила переводить свои посты на все эти итальянские, португальско-бразильские и китайские языки
отказался. Предложила в текстах поменьше использовать “правильно написанных” на правильном английском терминов, цитат и названий, и следить за тем, чтобы заголовки постов содержали написанные на русском слова. И блог назвать русским словом - чтобы в титле, который генерится у него wp-движком, чётко и сразу угадывалось содержание для русскочитающей аудитории.
Знать, куда посмотреть, какие данные с какими находятся в связи, влияют друг на друга, что нужно с чем сопоставлять… и только потом уже делать далеко идущие выводы, и дальше уже идёт работа сродни тому, что цыганка при гадании рассказывает - ТОЛКОВАНИЕ, для этого другой уже талант нужен.

Странно. Я только что свой аналитикс глянул — так там покзатель отказов по en-us всего 55%.
При этом у ru — 60% отказов.
А ведь все потому, что даже русскоязычный пользователь может поставить себе en (точнее — не переставлять на ru), так что это тоже неточный показатель. У меня, например, Опера и ФайрФокс запрашивают en, IE — ru, потом en-us. А где это настроить в Сафари я пока что не нашел, но подозреваю что там стоит en.
Вот вам и неточности.
“en-us” в самом деле не очень хороший пример. но “ar-sa”, “bg”, “cs”, “it”, “nl”, “pt-br”, “zh-cn” - здесь 100%-е отказы удивления не вызывают, вероятнее всего дело именно в языке
а на общую статистику влияют сильно.
Да, это языки которые по умолчанию не выставлены.
Но в этом случае отказам удивляться не приходится.
Соц. сети скоро или все поглотят, или умрут. ИМХО
«…и сия пучина поглотила их в один момент»
Ещё не скоро поглотят и тем более не скоро умрут. Но будут преобразовываться, будут стираться всё больше границы между типами проектов; они будут переростать друг в друга, может быть - сливаться в единое пространство, может - делиться сервисами.
Про результаты поиска разное: [...] интересно. В бэклинках (впервые) обнаружено вот такое. И что они там напереводили? Заметка о статистике, [...]