В разделе Обзор у ChatGPT можно увидеть список приложений (жпт-шек), созданных и натасканных по определенной теме.
Именно там я и искала помощника по визуализации данных, чтобы посмотреть, как у нас дела обстоят с автоматизацией создания графиков.
Выбирала помощника я по количеству комментариев, по описанию и по завлекательности (например, лучшие датавиз практики привлекли меня, несмотря на малое число комментов). А вот в датасаянс я не пошла, там явно акцент на другом.
Во всех ЖПТ-шках процесс моего тестирования был примерно одинаковый:
-
Загружаю таблицу CSV с данными о результатах опроса с компьютера (можно подключить с гуглдиска, но я не стала тут правами делиться).
-
Выбираю один из предложенных вариантов беседы, что поинтереснее (у жпт-шек часто есть варианты диалога, так что не надо все руками писать).
-
Слежу за развитием событий, добавляю пожелания.
ЖПТ-шками, которые занимаются анализом данных, успешно пользоваться получится только под премиум, потому что многие функции сильно ограничены. Несколько запросов в день вы сделать сможете, но на самом интересном месте наступит пауза… Ждите несколько часов.
У меня сейчас премиум, так что развлекаюсь.
Data Visualization Expert #1
Итак, первый кандидат. Посмотрим, что он сможет нам визуализировать на примере датасета о предпочтениях в напитках датавиз чата. Это простой набор данных из гугл-опроса, где есть срез по возрастам, полу, географии и профессии, а также список предпочтений в алкогольных и безалкогольных напитках.
Жпт-шка предлагает создать скаттерплот или барчарт на основе датасета. Будем слушаться ее предложений.
Аналитика не особо полезная. Что до визуализации, она тоже не очень удачная:
-
Подписи по диагонали трудно читать. Что стоило сделать барчарт горизонтальным?
-
Нет меток данных, данные воспринмать сложно.
-
Зачем-то нарисована сетка, если от горизонтальной хоть прок есть, вертикальная просто так.
-
Но хоть отсортированы значения, уже хорошо.
В итоге, я нажимала на предложенные кнопки, а он рисовал мне графики. Часто там была проблема с цветом, смысл то был, то не был. В какой-то момент я запросила нормализировать бар-чарты, потому что все распределение показывало в итоге гендерный состав чата, а не информацию о напитках. Дальше он работал уже с процентами.
Так как чатжпт показывает, как он кодит, то видно, что графики сделаны на matplotlib — питоновской библиотеке для анализа данных и визуализации. Но там не так много чего можно настроить красивого, а то, что можно — чатжпт не настраивает.
Так что красивых визуализаций тут ждать не нужно. Максимум — получится оценить структуру данных. Что тоже может быть неплохо. Но сходу симпатичных отчетов не ждите.
Вот вам еще пример визуализации:
Ух!
В какой-то момент появилась возможность делать графики интерактивными. Интересное свойство (работает не для всех типов диаграмм). Исследуем!
График вдруг меняется, немного скругляется — возможно, это уже другая библиотека вступает в игру. Спросим. И действительно. Plotly — более мощная питоновская библиотека визуализации, позволяющая интерактивность.
Вот так выглядит график с включенной интерактивностью.
В настройках графика появляется возможность изменить цвет легенды. И можно график скачать. Уже неплохо.
Кроме собственно визуализаций, жпт-шка делает также выводы, хотя они редко полезные, обычно это общие слова обо всем и ниочем:
Предлагаемые варианты анализа дают ка подтверждение своей идеи графики, но это обычно не очень удобно считывается. Зато посмотрите на эту палитру!) Ух, аж захватывает дух!
Выводы:
-
Понравилось, что можно просто тыкать в варианты анализа данных.
-
Графики оформленны вообще не по лучшим практикам визуализации данных.
-
Цвета вырви глаз.
-
Классно, что показывает код и что есть настройки графиков, по идее можно запросить визуальное улучшение графиков, но я не стала.
Data Visualization Expert #2
Теперь попробуем этого красавца (мило, что его зовут также как и первого, меня заинтриговало описание про лучшие датавиз практики, которым он следует).
Ну что ж. После ответа на предложенное “Создать графики на основе этого датасета”, я получаю тот же график в matlibplot только синий. И где же лучшие практики датавиза? почему на бочок не положили, чтобы подписи стали горизонтальными? Где метки данных?.. (риторические вопросы)
Тогда я решила уже напасть на него серьезнее, не хочется видеть все то же самое, только в синей палитре, что и у прошлого подопытного.
Пайчарт! Не очень старался:
-
Сектора не отсортированы от полудня.
-
Слишком много секторов (стоило объединить часть в «Прочее»).
-
Но есть метки данных, что я начинаю ценить.
О, а вот и барчарт на бочку. На самом деле не все так плохо, визуал и правда стал получше, хотя до лучших практик тут еще ползти и ползти…
-
Зачем у графика рамка?
-
Зачем контуры у баров?
-
Где метки данных? Если бы они были, можно было бы убрать не очень полезную ось.
Следующее мое коварство, конечно, было про дата-сторителлинг:
В итоге тоже получаю набор сомнительных графиков и некоторые выводы. Но тут мы уже видим хоть каку-то конкретику, а не только “разнообразные предпочтения”. Хотя график страшен, как смертный грех. И конечно, никакого сторителлинга в нем нет!
И тут он меня удивил. Появилась вот такая плашка:
Конечно, я хочу дашборд! Я люблю дашборды, меня хлебом не корми, дай сделать какой-нибудь дашборд! Больше дашбордов богу дашбордов!!!
И вот он мой дашборд! Да… Он собрал все те же графики, что выдал мне в начале, кучкой. Ну не милун ли?
Потом появилось предложение, от которого BI-аналитику очень сложно отказаться… Мне предложили ДОБАВИТЬ ИНТЕРАКТИВНОСТИ в мой прекрасный дашборд.
О да. Дайте две!
Это было непростой задачей. Он мучался. Что-то писал, переписывал. Получал ошибки и сам разбирался с ними, я в этом не участвовала. Только сочувствовала и ела попкорн перед экраном.
И потом предложил мне скачать мой интерактивный дашборд! Я сперва напряглась (картинку дашь, бес??), но это оказался HTML файл. С интерактивным дашбордом! Там можно было наводить на столбик и видеть подсказку! ВОУ ВОУ!
А вы тут кросс-фильтрацию хотели? Ха… (хотя, может, удастся обсудить и это с чатом?)
Из наблюдений за дашбордом — мужчины не пережили переноса в интерактив… Выжили только женские особи. Суровая дашбордная эволюция.
Попытки добыть глубокую аналитику и кросс-фильтрацию провалились.
Но, если вы работаете на питоне — то можно довольно быстро наваять интерактивные панельки. Интересно.
Выводы:
-
На самом деле, несмотря на скромное количество отзывов, жпт-шка довольно мощная. Интерактивный дашборд — это сильно, я вспоминаю, сколько дней я потратила делая простенький html-дашборд на chart.js, и полагаю, с таким помощником это заняло бы максимум полдня. А то и пару часов.
-
Понравилось, что он правда пытался улучшать диаграммы, хотя успехи его не очень существенны. Понравилось, что выводы стали конкретнее.
-
Так что инструмент перспективный, но конечно ошибки выдает, сам от них страдает — это забавно.
Interactive Data Visualization
Воодушевившись возможностями интерактива, я выбрала для опытов вот этого малыша.
Этот товарищ с наскока предложил мне сделать диаграмму Облако слов (Word Cloud)! Конечно же я согласилась, он мне показывать результат не стал, пожужжал там и предложил скачать картинку. Штош. Плюс за старание!
Дальше я скачивала интерактивный график HTML с распределением по возрастам.
Дальше он меня опять отправил устанавливать Dash. Так что на улице питонистов конечно перевернулся грузовик с пряниками… Хотя для JS я тоже использую чат жпт, он мне там рисует всякое красивое))
Ключевые инсайты меня заинтриговали и я продолжила общаться с этим чатом:
Мдамс… распределение показывает четкие группы. Ну теперь-то все понятно. Спасибо, кэп.
Выводы:
-
Сам графики не показывает, дает ссылку на скачивание. Таинственный такой.
-
Готов помогать делать в интерактив, но это уже вне его компетенций из коробки.
-
Выводы делает так себе
-
Не, ну вы видали облако слов??
Data Visualization Expert #3
Как я говорила, я люблю дашборды, люблю Power BI и Tableau, так что не могла пройти мимо очередного датавиз эксперта, который работает с биай.
В целом поболтать с ним было интересно, он подготовил мне данные для дашборда в Tableau и говорил что делать. Но я хотела выжать из него креативную сложную визуализацию. Посмотрим, получится ли.
Красавчик долго думал и в итоге… сделал мне хордовую диаграмму!
Правда это не хордовая.
И не в Tableau, а на питоне..
Но плюс за попытку.
Так, давайте будем упрямее.
Ну что, погнали?
Самое классное конечно, что можно делать скриншот ошибки и сразу прикладывать. И он понимает. Богично!
В итоге я загрузила данные в Tableau, соединила (не с первого раза) две таблицы, создала 6 простых переменных, копируя нужные формулы. Но диаграмма из них так и не собралась… Проблемы с контекстом вычислений, и со скриншотами, и без, мы ее не решили. Опять придется идти на Tableau Public и TuTube, чтобы сделать сложную креативную диаграмму.
Но попытка выглядела реалистично!
Выводы:
-
Потенциал есть, но результата особо не получили
-
Впрочем, хордовая это вам не хухры-мухры, думаю, с обычными диаграммами скрипт неплохо справится.
-
Очень понравилось кидать скриншоты ошибок. Ведь тут их текстом не добыть. Новый успешный опыт, раньше такого не пробовала.
Общие выводы
1) Ну что ж, интересно следить за успехами в этом направлении. ChatGPT действительно неплохой помощник в анализе данных — например, когда нужно немного переверстать ваш набор данных и посмотреть общую структуру данных (никуда не ходя).
2) Прикольно, что он стал хорошим помощником программистов и биайщиков, можно пробовать что-то кодить с их помощью и писать формулы.
3) Что насчет красивых визуализаций — этого я пока что нигде не вижу. Все-таки точной настройки не хватает, строгих правил. Может быть, мне не попалась хорошая жпт-шка, может быть, АИ этого в принципе пока не понимает. Будеми наблюдать. Пишите, если знаете такое!
4) Много занятных открытий: Дашборды! Интерактивные графики! Чтение ошибки по скриншоту! Облако слов! Псевдохордовая!
Спасибо, что прочитали!
Мена зовут Наталья Киселева. Я эксперт по визуализации данных и смежным направлениям, преподаю и веду каналы по теме датавиза. Про Дата-сторителлинг и про Дата-комиксы.
ссылка на оригинал статьи https://habr.com/ru/articles/870112/
Добавить комментарий