ru
Назад к списку

Как стать Data Scientist?

22 Февраль 2019 13:03, UTC
Маргарита Гвоздева

В настоящий момент на рынке труда одними из самых востребованных специалистов являются Data Scientists. Для тех, кто не знает (стоит заметить, что многие не понимают сути данной профессии), Data Scientist – это человек, который умеет делать содержательные выводы из больших баз данных, используя при этом математический аппарат и программирование. BNT поинтересовался у экспертов, как можно стать таким суперчеловеком и сколько на это уйдет времени.

Где востребованы Data Scientist

Профессия Data Scientist сейчас находится на пике популярности. Многие организации активно ищут квалифицированных специалистов в этой области и готовы предложить интересные проекты для работы. Predictive analytics (предсказательная аналитика) и prescriptive analytics (предписательная аналитика) набирают обороты в различных индустриях, начиная с информационных технологий и заканчивая сельским хозяйством. Например, в практике одного из экспертов был случай, когда на ферме собирали сенсорные данные с датчиков на животных, чтобы в дальнейшем строить модели по предсказанию их возможных заболеваний.

«Работа с большими данными стала отдельной отраслью, куски которой применимы в любом бизнесе: реклама, e-commerce, финансы, производство. Везде, где есть больше одного параметра, есть место для глубокой аналитики данных»,

– комментирует Антон Немкин, управляющий партнер AT Consulting.

За интересную работу предлагают интересные деньги. Так, начинающий Data Scientist в Москве может рассчитывать на заработную плату в размере около 100-120 тыс. руб., специалист уровня middle – на 140-150 тыс. руб. (в отдельных компаниях до 200-250 тыс. руб.), специалист уровня senior/teamlead – от 200 тыс. руб. до очень внушительных цифр у отдельных мегапрофи.

Стоит заметить, что квалифицированные сотрудники в этой области востребованы и за границей. Например, в Великобритании начальная зарплата Data Scientist составляет около 40 тысяч фунтов в год и выше.

Что должен уметь Data Scientist?

Эксперты выделили следующие ключевые области, в которых должен разбираться Data Scientist:

  • математический базис (теория вероятностей, математическая статистика, методы оптимизации, линейная алгебра);
  • навыки программирования (python, SQL, С++ и очень желательно Hadoop);
  • знание моделей и методов машинного обучения (ML) и практический опыт применения ML;
  • навыки общения с бизнесом и способность понимания его задачи.

Data Scientist должен уметь не только анализировать большие базы данных и строить сложные модели, но и делать содержательные выводы из этого анализа, полезные для той сферы, в которой он работает.


«Помимо владения технической базой, Data Scientist должен уметь объяснять методы анализа и полученные результаты людям из других профессиональных сфер, а также знать английский язык – без него сейчас вообще никуда»,

– заметила Анна Румянцева, Data Scientist Hitachi Vantara.

Кто может стать Data Scientist?

Безусловно, проще всего стать Data Scientist молодому специалисту, который имеет математическое или IT-образование. Однако если набраться терпения, то практически в любом возрасте можно стать аналитиком больших данных (пусть и не суперуровня), правда, с оговоркой, что познания в математике не ограничиваются таблицей умножения, а аналитика является природной способностью.

Плохая новость – гуманитариям будет нелегко без базовых знаний о современном математическом анализе. Можно будет только строить догадки, глядя в бесконечный набор цифр. 

Хорошая новость заключается в том, что инструментарий упрощается, а знания становятся более доступными. Существует множество платформ (KNIME, DataRobot), которые позволяют демократизировать профессию и упрощают процесс создания моделей. Это дает возможность людям с разными профессиональными навыками ознакомиться с работой Data Scientist. Однако, по мнению специалистов, фундаментальные знания математики все-таки очень важны для карьеры: они позволят освоить новые алгоритмы в этой области, и без них будет невозможно работать с частью проектов.

Сколько надо учиться?

Отвечая на вопрос, за какое время можно освоить новую профессию, Андрей Могорас, руководитель отдела машинного обучения, обработки и анализа данных краудлендинговой платформы Penenza.ru, заметил, что это очень индивидуально. «Но думаю, за несколько месяцев можно получить базовые навыки в области математики, программирования и машинного обучения, а дальше – только практика, и чем больше – тем лучше. На мой взгляд, среднему специалисту нужен минимум год практического применения ML в реальных задачах. Опыт участия в соревнованиях по ML (kaggle и др.) весьма полезен, но не заменяет практики решения реальных задач бизнеса», – отметил эксперт.

Однако для того, чтобы стать специалистом высшего класса, нужно сначала получить университетское образование в технической области (физика, прикладная математика, программирование). Кроме этого, потребуется самостоятельное обучение и участие в проектах, связанных с Data Science – многое зависит от энтузиазма и готовности упорно работать. Конечно, было бы неплохо пройти стажировку по специальности – она может занимать 1-2 года. Итого потребуется около 6 лет. Дальнейшее повышение навыков зависит от того, какую карьеру хочет построить человек.

Специалисты уверены, чтобы стать true Data Scientist, необходимо не только получить образование, но также важны разнообразная практика и природные способности.

Что касается подготовки, то сейчас существует множество специальных курсов подготовки Data Scientist (ШАД Яндекса, Coursera), а также профильные технические вузы (ВШЭ, ФизТех, МГУ, МФТИ, МИФИ).

Безусловно, научиться можно практически всему и в любом возрасте, однако для того, чтобы стать первоклассным специалистом в сфере Data Science, нужно приложить максимум усилий. Если нет природной любви к математике и аналитике, а также если вы далеки от программирования, то лучше выбрать какую-нибудь другую профессию.

Иллюстрация: Medium