Как стать Data Scientist?
В настоящий момент на рынке труда одними из самых востребованных специалистов являются Data Scientists. Для тех, кто не знает (стоит заметить, что многие не понимают сути данной профессии), Data Scientist – это человек, который умеет делать содержательные выводы из больших баз данных, используя при этом математический аппарат и программирование. BNT поинтересовался у экспертов, как можно стать таким суперчеловеком и сколько на это уйдет времени.
Где востребованы Data Scientist
«Работа с большими данными стала отдельной отраслью, куски которой применимы в любом бизнесе: реклама, e-commerce, финансы, производство. Везде, где есть больше одного параметра, есть место для глубокой аналитики данных»,
– комментирует Антон Немкин, управляющий партнер AT Consulting.
За интересную работу предлагают интересные деньги. Так, начинающий Data Scientist в Москве может рассчитывать на заработную плату в размере около 100-120 тыс. руб., специалист уровня middle – на 140-150 тыс. руб. (в отдельных компаниях до 200-250 тыс. руб.), специалист уровня senior/teamlead – от 200 тыс. руб. до очень внушительных цифр у отдельных мегапрофи.
Что должен уметь Data Scientist?
Эксперты выделили следующие ключевые области, в которых должен разбираться Data Scientist:
- математический базис (теория вероятностей, математическая статистика, методы оптимизации, линейная алгебра);
- навыки программирования (python, SQL, С++ и очень желательно Hadoop);
- знание моделей и методов машинного обучения (ML) и практический опыт применения ML;
- навыки общения с бизнесом и способность понимания его задачи.
Data Scientist должен уметь не только анализировать большие базы данных и строить сложные модели, но и делать содержательные выводы из этого анализа, полезные для той сферы, в которой он работает.
«Помимо владения технической базой, Data Scientist должен уметь объяснять методы анализа и полученные результаты людям из других профессиональных сфер, а также знать английский язык – без него сейчас вообще никуда»,
– заметила Анна Румянцева, Data Scientist Hitachi Vantara.
Кто может стать Data Scientist?
Плохая новость – гуманитариям будет нелегко без базовых знаний о современном математическом анализе. Можно будет только строить догадки, глядя в бесконечный набор цифр.
Хорошая новость заключается в том, что инструментарий упрощается, а знания становятся более доступными. Существует множество платформ (KNIME, DataRobot), которые позволяют демократизировать профессию и упрощают процесс создания моделей. Это дает возможность людям с разными профессиональными навыками ознакомиться с работой Data Scientist. Однако, по мнению специалистов, фундаментальные знания математики все-таки очень важны для карьеры: они позволят освоить новые алгоритмы в этой области, и без них будет невозможно работать с частью проектов.
Сколько надо учиться?
Отвечая на вопрос, за какое время можно освоить новую профессию, Андрей Могорас, руководитель отдела машинного обучения, обработки и анализа данных краудлендинговой платформы Penenza.ru, заметил, что это очень индивидуально. «Но думаю, за несколько месяцев можно получить базовые навыки в области математики, программирования и машинного обучения, а дальше – только практика, и чем больше – тем лучше. На мой взгляд, среднему специалисту нужен минимум год практического применения ML в реальных задачах. Опыт участия в соревнованиях по ML (kaggle и др.) весьма полезен, но не заменяет практики решения реальных задач бизнеса», – отметил эксперт.
Однако для того, чтобы стать специалистом высшего класса, нужно сначала получить университетское образование в технической области (физика, прикладная математика, программирование). Кроме этого, потребуется самостоятельное обучение и участие в проектах, связанных с Data Science – многое зависит от энтузиазма и готовности упорно работать. Конечно, было бы неплохо пройти стажировку по специальности – она может занимать 1-2 года. Итого потребуется около 6 лет. Дальнейшее повышение навыков зависит от того, какую карьеру хочет построить человек.
Специалисты уверены, чтобы стать true Data Scientist, необходимо не только получить образование, но также важны разнообразная практика и природные способности.
Что касается подготовки, то сейчас существует множество специальных курсов подготовки Data Scientist (ШАД Яндекса, Coursera), а также профильные технические вузы (ВШЭ, ФизТех, МГУ, МФТИ, МИФИ).
Безусловно, научиться можно практически всему и в любом возрасте, однако для того, чтобы стать первоклассным специалистом в сфере Data Science, нужно приложить максимум усилий. Если нет природной любви к математике и аналитике, а также если вы далеки от программирования, то лучше выбрать какую-нибудь другую профессию.
Иллюстрация: Medium