Кейс-интервью в Data Science: BCG GAMMA | #Нанято S1E04RU

Подготовка к собеседованию на Data Scientist

Транскрипция видео:

  • сегодня в нанята необычный собес смесь классического кейса и дейта сайнс от би си джи гамма особенность такой интервью в том что кандидат должен шарить и в технической части млм бизнеса вых целях и причинно-следственных связях что это такое я конечно 5 минут не расскажу но оставлю ссылку на статью с подобным расскажем ссылка будет в описании к видео впрочем много станет понятно по ходу дела а что останется непонятным спросите в комментариях я с радостью отвечу на то они и нужны эти комментарии и конечно не забудьте подписаться

    00:00:03 - 00:01:16

  • замкнуть колокольчик и поставил лайк если шива вам понравилось меня зовут виктора гуленко и вы на канале поехали [музыка] добрый день меня зовут геннадий фильм спасибо что пришел на интервью предлагаю построить наше интервью следующим образом она у нас займёт всего порядка около часа плюс-минус сначала мои представимся энергия начну после этого поговорим про один из своих проектов либо там твой любимый проект идут последние не по которым ты гордишься тут уж что ты выберешь и после этого минут на 20-30 у нас будет кейс за

    00:00:40 - 00:02:02

  • бизнес задача прямо пересечении бизнесом а шиллинга немного наверно еще перешли себе затронем если пойдет туда и в конце у тебя будет возможность задать мне вопросы отлично отлично да тогда я начну меня зовут геннадий федин я би си джига можно работаю практически три года через недельку через две недели будет три года би си джи вас на вам занимают все задачи мира связанными с авиалиниями с туризмом различные оптимизационной задачей для нескольких европейских и американских авиалиний также делал кейсы связанные с

    00:01:25 - 00:02:36

  • промо оптимизации как для ритейлеров то есть о которой у нас магазины под домом так и для поставщиков том числе анализ исторических промо что хорошо отработала что прав плохо так и делали автоматически инструменты для формирования промо планирования в будущее то есть кольца какой у нас должен быть оптимальный пром план через там три месяца на несколько месяцев вперед до пи си джи работал как работал в основном учился работал в университете вышка в экономике там закончил магистратуру аспирантуру

    00:02:00 - 00:03:05

  • преподавал и вот где там на втором третьем курсе аспирантуре решил уже пойти в би си джи гамма прикладывать свои знания сама гамма у нас ей на самом деле немногим больше чем три года это международное подразделение би си джи там порядка тысячи человек работают интересно то что если там отличие от классического консалтинга в москве у нас международный stuffing то есть проекты мы часто можем выполнять в любой точке мира сейчас конечно удаленно но раньше как особенность войска только райские красиво да да да но в америку чуть

    00:02:33 - 00:03:40

  • сложнее потому что нужно на особый тип рабочие визы но и принципе делают если твоя экспертиза отлично подходит действенная думаю раньше но вот би си джи возможно то есть кнопка хищницу консультантом чуть-чуть сложнее попасть какой-то амстердам осла или еще что но для гамм это как у нас центральный классе stuffing то есть те кто решает куда ты поедешь глобальный не локальный то большое количество зарубежных проектов вот теперь если может раз представьте приятно познакомиться меня зовут виталий цветков

    00:03:07 - 00:04:18

  • начинаю хронологии так более стройным приставания первое мое образование бокалы ряд инженерный получал там было больше связана с проектированием микросхема такими вот техническими штуками потом чуть-чуть решил изменить вектор своего скажем так карьерного развития пошел в магистратуру уже на внедрение эти системы ну там были такие ну рассказывали вам про коробочное решение там sap и других игр пешеход соответственно 1 стажировку меня было лаборатории касперского где я работал вып аналитиком набор тайме потом меня

    00:03:42 - 00:05:02

  • немного как повелел скажем так разным возможностям пошел сиверский онг намо года эти аудитором отработал к слову то не совсем получил то что ожидал потом пошел в danone на краске внутренние департамент который занимается внедрением sopa и таких штук там встроил этель систему по переносу данных из каких-то исторических систем краски фз об основном там мы склеили писал и такими штуками с рядом с данными занимался вот ну и наконец текущее место работы это сбербанк соответственно туда я 1 место где я так

    00:04:22 - 00:05:50

  • скажем уже вошел более серьезных date sites там я работаю именно в бизнес команде по операционным риском внутри сети продаж то есть именно занимаюсь тем что наша команда минимизирует какие-то убытки ущерб который банк может получить там от внутреннего фродо ошибок и похожих вещей вот могу более подробно наверное про какие-то проекте который именно давай расскажи про какой-нибудь свой любимый проект да ну как пример могу вот из последнего что мы сейчас внедряем у нас краски идет пилот это модель по

    00:05:07 - 00:06:33

  • примитивному выявлению фальсификацией бизнес-план сотрудниками мы это называем с 3 продаж то есть когда сотрудники навязывают клиентам продукты которые они ну которые возможно не нужны они скорее хотят получить большую премию там каким-то причинам вот соответственно наши наши модели там берем много вещей которые у нас из разных из разных отделов банка к нам попадают как-то пытаемся собрать из них все которые наиболее влияют на именно вот этот бизнес процесс по обслуживанию клиентов там по навязыванию продуктов ненужных и

    00:05:49 - 00:07:25

  • выбираем те которые в идеальной картине мира те которые мы как вот бизнес-подразделения можем повлиять непосредственно то есть сказав там либо сама сотруднику либо его руководителю чтобы они могли по как-то оптимизировать его поведение у дальнейшем то есть там может быть он слишком много времени там тратить на какие находят тип операции может быть какие-то продукции у него хуже идут лучше и так далее вот ну сразу скажу что это вот в идеальном мире так происходит на самом деле у нас больше час на

    00:06:37 - 00:07:56

  • статических фичах это построено то есть как бы мы хорошо хороший аранжирую способность модели но с интерпретации пока не так все гладко то есть освобождена чтобы ранжируется ну и самих сотрудников то есть у нас есть там какое-то количество вот продающих должностей по всей россии и у нас по сути есть рейтинг их от наиболее рисковых к не менее рисковыми допустим мы выделяем по пакетам там самый красный самой рисковых баки на них мы как бы обращаем больше внимания там даем им какой-то тип задач либо им либо его руководителю есть

    00:07:17 - 00:08:42

  • менее рисковые с которыми что лучше будем сосредотачивать ресурс как бы вот наша сотрудников на более вероятных а рельсы заключается в том что они продают не то что нужно клиентам ну да да да как пример то есть клиент приходит в отделение не знаю там перевести деньги со вклада там на какой-нибудь другой счет ему при этом начинают там какую-то страховку впаривать не впаривать и в итоге стопок может большой пример страховка в принципе нужно ли как правило да но может быть там какие-то продукты которые мы там не знаю хотя

    00:08:00 - 00:09:27

  • пожилой человек общине воспользоваться интернет сервиса или что это супер бокова не подключить нужно будет ну соответственно могу еще писать какие-то более такие мелкие задачи можешь нам тогда писать какая была команда какая твоя роль в команде да ну смотри у нас как структура есть непосредственно вот наши бизнес команды мы пытаемся это вот внедрите бизнес-процесса как-то подружить с тем что уже у нас есть в банке к что задачи которые там стоять на сотрудников как-то их меняют их поведение есть вот отдел ребят

    00:08:46 - 00:10:10

  • которые непосредственно не могли занимается моделированием этих алгоритмов там коллективных моделей вот соответственно мы выступаем как бизнес заказчик и конкретно моей роли это я лидирую именно то что эта модель не к нам придет и пойму полностью как она работает что там верифицируем как то и результат что и результата действительно можно доверять спаррингом и непосредственно в бизнес процесс чтобы она зашла как и был какой-то ощутимый результат ну либо эффекты бы не было то есть как-то протестировать это все

    00:09:28 - 00:10:45

  • естественно на практике как тестируйте ну вот сейчас у нас на примере этого кейса с пустым продажами идет разделение на то есть мы выбираем там какой-то пул сотрудников пусть там и будет 20000 у нас есть допустим на верхушку по модели самой опасной 4000 потом менее опасный 4 тысяч ну это к цифры спал камеру вот и ну то есть так и дошкольниках и допустим мы вот из этой 1 1 группы 1 bucket самых тамарисковых людей берем рандомных перемешиваем две группы то есть такой об это сделаем ставим на одну группу задачи на другую

    00:10:08 - 00:11:42

  • группу не ставим средства также с другой нижней грубым просто ставить задачи то есть сравниваем эффект от разного типа воздействия вот ну и соответственно на остальных сотрудников мы с ним ничего не делаем измеряем эффект на а по-моему есть еще третья группа где просто арендованных сотрудников мы ставим какие-то задачи и ну садись на сто лет ничего не ставим как эффект мерить и что под эффектом ну эффект в идеале как бы он должен состоять в том что доля пустых продаж эту именно сотрудников на который мы поставили

    00:10:54 - 00:12:14

  • задачи все еще месяц она уменьшается а ну то есть сотрудник меньше начинает фонить навязывать не то что нужно и так далее а за счет чего то есть вы ему какие-то дополнительные целевые задачи вставить или за счет чего она будет меньше 1 у нас есть пока что только гипотезами мы их еще не подтвердили на практике то есть это как бы проект в разработке то есть и сотрудника мы либо ему напрямую через там систем который руководство как бы ставит какие-то задачи там срочные и несрочные сотрудник или его рука воздух

    00:11:35 - 00:12:51

  • прилетают ему вот эти вот задачки отклонения и он их как бы с ними ознакамливается пишет там свой комментарий если хочешь типа там отработал не отработал почему и соответственно затем проходит какое-то время мы смотрим на сотрудников которые оставляли один тип комментариев к нам дела идут как идет идут дела у тех кто просто проигнорировал это ну соответственно раскручивается как-то с точки зрения бизнеса там еду просто довольно большой есть вариант варианты того что можно делать такое пространство скажем так

    00:12:16 - 00:13:35

  • воздействие просто 10 каких-то очень а модели ты получать получаешь от другого конкретно эта модель да раньше было и так что я сам строил модели какие-то то есть допустим у нас была модель по ошибкам в кассу просчетом я применял там тоже различные методы по нашим печам стоило тоже опять же schooling сотрудников по самых рисковых менее рискован то есть использовал там столь смогли дивный busting ольга бы использовал наш внутренний зверский html когда он еще был сейчас возможно он сейчас он точно уже

    00:12:55 - 00:14:15

  • такой более и более продвинутой форме по моему его даже an open-source не git хоп выложили может то есть любой желающий воспользоваться вроде как и довольно неплохие кстати результаты показывается на каких-то задачах которые с табличными данными на завод то есть использовал да такие решения тоже приходили каким-то результатам тоже был некий эффект а какие пакет пакет какой софт использовал то есть какие объемы данных да ну смотри мою весну эстакад питон конечно сами данные я и у нас страдать и как правило хранятся плюс там

    00:13:36 - 00:14:49

  • есть наши собственные резки то он тоже на базе сколь в которых там различные метрики агрегируется приходит к нам в итоге получается такое что на питоне вода как я сказал лайк там с включением катара дать им выкачиваем таблицы из разных разных мест и соответственно скорем завод на текущий там на следующем месяце какие-то разные периоды скажем так у нас нет пока что продвинутого такого white line а что там с помощью как антиверо flow там что было регистрация всякие такие пенсии что деваться объем данных какой то есть

    00:14:12 - 00:15:33

  • тонны и либо это парк парк ну не знаю к счастью к сожалению по из парка у нас нет то есть у нас позволяют объемы сотрудники когда они уже загримированных страдать и не занимают такой большой встрече generation от автора дать потом уже выкачивается может генерация печей там в трогательно разных таблицах агрегации там с разных уровней допустем есть очень большая таблица по каким-то инфекционным данным по годам и и прочему но к нам в итоге представления она уже приходится агрегированных вещей там допустим средний этом идеальные значения

    00:14:52 - 00:16:01

  • там за месяц за последние шесть месяцев то есть на различных таких деревнях на вы тогда объем данных бывает сто с чем-то тысяч сотрудников там и в максим может быть 200 фичей в месяц видео грамм нас некоторые модель там и еженедельный есть по ним примерно такие же объем и там не просто чуть-чуть хуже даст этим с этими больными которые еженедельно запускаются на кому поэтому не супер большие то есть у нас как бы банки есть hadoop есть там лаборатории данных из которых тоже хранится и так понимаю очень большую

    00:15:28 - 00:16:50

  • может когда-то большая помойка скидывают и какая-то часть этих вещей я подозреваю они как раз таки с ходу пав тоже про дату приходится преобразовывается то есть там уже по сути разные агрегат таблиц просто транзакции из них берутся делать что-то а вот в той маг моделях ранжирования там рискованных сотрудников какие там целевые функции на что смотрит хорошая модель ну как бы самый такая для нас понятно как для бизнеса департамента это один мера и различные и части то есть допустим построили какую-то модель

    00:16:09 - 00:17:34

  • который уже есть хорошая аранжирую щая способность там на примере рука ук то есть что в целом модель хорошо может поменять с хорошей вероятностью сотрудника в целом ускорит но нам нужно выбрать допустим хороший порог по тем сотрудникам которым мы будем какие тут уже явные действия совершать и по сути просто подбором порога мы выбираем там оптимальные для нас отношении престиже нарикала то есть строить скрывает на президента и создаем вместе замерщик да получается вы что предсказывает вообще модель кроме ранка

    00:16:51 - 00:18:08

  • то есть она предстает видим вероятность сливаются льва переменная это по сути вероятность что доля про пустых продаж там будет вот больше какого-то критического значения которые мы там определили в начале исходя из того насколько там это вот общей популяции сотрудников разделяется то есть у вас некоторое man сказать кластеризация сотрудников происходят до сегментация да то есть и есть сегмент красных сотрудников как мы их называем желтых и зеленых в разных моделях по разным происходит но как правило задача такие вот скоренко

    00:17:29 - 00:18:48

  • имитация а если модель уже шпрот выкатывается к это кто-то деле поддерживает до у нас у нас есть ну может так сказать команда дат инженеров дата налетчиков которым ну собственно вот я допустим собрал модели собрал там все все источники данных откуда она забирает там допустим есть какие данные которые не лежат в общей банковской песочница только у нас там я эти все процедуры те подбил там в один питон скрипт сделал там поудобнее чтобы это читалось разные функции так далее вот протестировал что все работает и отдаю

    00:18:09 - 00:19:33

  • как бы на поддержку ребятам аналитиком который у нас сидят рядом с нами в общем подразделение починить так находится они по сути каждый месяц запускаются эту модель какие споры гриба не появляются если там появляются какие-то вопросы там или может быть доработки нужна тебе для модели то собственном снова мы дали возвращаемся дорабатываем и и отправляем ребятам они его запускают джо бы какие то делают и так далее а и тельно чем ты пишешь питание там panda su спать или что-то да конечно пандус это для меня

    00:18:50 - 00:20:01

  • этого панда снимем самое такое удобное вообще библиотека по которой можно такие табличные данные там пошерстить следуете так далее но изначально конечная цель какой-то зашивают подключаюсь там каким-то connectionstring страдать и все это собирается мне в пандус если там нужны какие-то еще преобразование чтобы именно фич инженеринг чтобы там в модель как-то может быть нормализовать фичи там ад стиль этих это уже до внутри питона там наполнитель нам пойдет а почему ты хочешь именно dots сайнс то есть пойти к

    00:19:26 - 00:20:37

  • должен развиваться даже какой-нибудь просто больше бизнеса вай аналитику хороший вопрос я так думаю что лично мое такое мироощущение что дата сайнс как бы можно делать интересные штуки по сравнению с ну не хочу перемещать там какие-то имена людей которые бизнес-аналитика занимается но я просто на своей шкуре из контакт чуть испробовал от в той же магистратуре в когда это был в да но не выросли я ничем контакт когда они не напрямую писал код а больше так пытался анализировать какие то процессы скажем так больше именно

    00:20:02 - 00:21:38

  • общаться с людьми там с сотрудником специалистами разработчиками опять же о том как там что-то лучше внедрить и понял что мне не знаю может по складам его характер характера интереснее своему закопаться данных ритм теперь сайты их там разворачивать делать на них модель который потом дают какой-то и пакт то есть для меня в последние годы достанется дар стал более осязаемым скажем так чем такие области как там системные или бизнес-аналитик то есть я понимаю что это как бы тоже важно без этого никуда

    00:20:50 - 00:22:08

  • но конкретно в моем скажем так мозгу до царства изначально чему не прилег я прям почувствую какую-то не знаю какой то магия того что у тебя просто есть данные ты их там скрываешь машине и она тебе предсказывать новые данные то есть для меня просто был к этого эффект который возможно до сих пор длится вот эти от и получается ему сам учился уже патель да я выходит изначально нам просто находил какие-то там даже entry-level курсы там по бетону по обработке данных где там какое-то начальное представление он получал зачем

    00:21:28 - 00:22:48

  • тоски это под project и реализую это может быть даже не кур серии там каких-то похожих курсах и вот так по сути и находилась первую работу в adsense то есть у меня поступки издана уходил к краски были офферы там почему-то но именно банки больше заинтересовались мне был там эфир в 1 банки и вот соответственно выбрал и затем уже когда пощупал это более близко то есть поработал с этим именно в привязке к каким-то бизнес-процессам к реальным там им потом которые то совершает я понял что нужно еще самосовершенствоваться как бы того что

    00:22:09 - 00:23:23

  • это на каких-то курсов получил конечно круто но возможно недостаточно соответственно я прошлом году сдавал еще экзамены в академии made at mail.ru group такая ну и думают развитием сферы или их раньше было или что то новое ну я не знаю на этом просто mail.ru очень много образовательных проектов различных платных и бесплатных вот это можно охарактеризовать как такой аналог шадо но может быть не такой я в шоке просто не учился не могу доподлинно сказать но в шаге скорее такое больше научные такое

    00:22:46 - 00:24:00

  • академических больше таких тем разбирается вот в миде такой более прикладные есть предметы например вот у нас был там вроде тот же самый там где мы докер кубер нету там изучали ну естественно никуда без таких основных тем как но письме даже там или на графах немного затронут расширял свой кругозор в области машину обучения и все слова я сейчас короткие учусь там то есть два семестра прошло и 3 будет осень завершающей как ты себе представляешь работу от себя в роли то то нечисто месси джигом какие-то

    00:23:23 - 00:24:44

  • думаешь у нас задача как общий проект выглядит ну я так понимаю что чем отличается д.с. в такой консалтинговой фирме от да если кто простоев продуктовый или просто индустрии работает это тем что в консалтинге у тебя скорее всего будет возможность как бы поработать не только надо одним типом задач ну наверное более широко посмотреть то что то что общее можно делать то есть может где-то там поработать с табличными данными какие там аранжирую щи и модели строить рекомендационные системы но также можно

    00:24:03 - 00:25:19

  • многих других проектов там и может быть какой-то сайте какими-то компании поработать или там в различных секторах экономики скажем так то есть нефть и газ там транспорт как более magic задачи ну и так понимаю связана с тем чтобы с клиентом скажем так сначала как-то установить вообще чего клиент хочет как бы собрать бизнес требование потом непосредственно уже строить модели которые скажем так оптимизируют какие-то узкие горлышке наверное в процессах этих соответственно блеск процессах где как я так понимаю вы работаете в тесном тесном

    00:24:41 - 00:26:15

  • связи с консультантами которые именно в деньгах это наверное все хорошо могут обсчитать и понять где лучше там применить все мы люди где хуже подходе на бывает [музыка] хорошо 2 и нарко и передем к кейсом есть у нас в связан с авиалиниями к нам обратился в европейский европейская компания занимается допустим предположим только авиаперевозками пассажиров тут грузоперевозки не затрагиваем они увидели что за последние годы у них сильно возросли это нам performance cost то есть издержки связанные не связанные

    00:25:28 - 00:26:56

  • с осуществлением самой самих перелетов то есть это издержки кроме кроме издержек на само топливо признаны строчка издержек для компании с топлива здесь мы говорим про все остальное почти все остальное то есть операционные какие-то до взросления посмотрели что проблема в том что у них там хуже стал on time performance то есть у них больше задержек рейсов позвали нашу команду посмотрели поняли что а нам нужно было бы хорошо если бы мы могли прогнозировать задержку рейсов вот как бы ты подошел к этой задачей на

    00:26:20 - 00:27:30

  • прогнозированием задержки рейсов окей да то есть видно что есть какая-то проблема с тем что видимо теряются это деньги да теряются [музыка] есть какой-то упадок в метриках ну наверное первое что надо начать это проговорить конкретно какую метрику нам нужно оптимизировать как бы улучшать то есть есть какие-то поэтому надо оптимизировать будем деньги ну и либо минимизировать издержки связанные с задержками как ты думаешь какие за счет чего какая компания теряет деньги когда рейсы задерживаются да то есть потери

    00:26:57 - 00:28:20

  • денег как мне кажется первое на что обратить внимание это когда простаивают самолет то есть никуда не летят соответственно меньше вообще итоговое количество рейсов совершается в компании тарисе мог быть отменены соответственно наверное могут пассажиры забрать деньги обратно то есть с как это связано задержками то есть вот задержали какой-нибудь самолет на но он приземлился на полчаса позже чем ожидали как вот в этом случае за счет человек компания теряет деньги ну я так понимаю что если если если

    00:27:39 - 00:29:13

  • если какой-то самолет позже приземлился возможно там был слот для другого самолета когда он должен был тоже предстать он тоже задерживается такая накладывается выходит что у нас и в итоге в конце этой реакции могут быть потери в понта что рис и в итоге может быть отменен скотина например последний рейс у нас там получилось и задержки что приземляется после уже того как аэропорт закрылся соответственно его нужно отменять это можно аэропорта закрываются то есть некоторая пор туда закрываются ночью

    00:28:31 - 00:29:34

  • соответственно там очень важно чтобы ты успел приземлиться того как он закроется но это скажем так когда он пропадает делай это уже может сказать издержки связанные задержкой последнего рейса например а вот если просто в середине дня где-то задержался самолет вот какие именно держите она конкретно вот с этим вот рейсом ну возможно ни на что не первое в голову приходит как человеку который как бы не глубоко в области перевозок но вот как пассажир ленту достанут лет я бы подумал что возможно мне было какое-то важной встречи там в

    00:29:08 - 00:30:14

  • городе там я лечу в нью-йорк у меня там встреч с инвесторами который стартап финансирует и они меня не дождались въехали в итоге остался без денег я могу засудить это вы наверно авиакомпанию с тем что были такие планы грандиозные меня не пошли вряд ли выиграть суд получится из то что авиакомпания сдержал на 30 минут но как формализовать возможно то что ты недоволен то что результате репутационные наверное коллег из них деньги хороший вопрос а но возможно мы как бы складывается плохое впечатление о нашей

    00:29:40 - 00:31:02

  • именно компании и у нас удержание клиентов находит становится говоря мы теряем клиентов уже привлеченных то есть это по сути наша метрика удержания клиентов наших to make the active users я не знаю как ты точно называется транспортным простую индустрии ну вот например если бы это была речь о каком-то там интернет-сайте там это был у нас метрика модели active users который нам очень важно которые каждый каждый день там другую у нас какое-то число и потом она увидим что он упал а тут возможно просто количество

    00:30:22 - 00:31:35

  • пассажиров которые которые летают наш мир или ними она снижается с со временем соответственно нам наверное нужную ну то есть выходит что так происходит пассажира только пассажиров но как нам его в деньги примерно там не очкуй вопрос какая может быть идея при ни на что перевести этот поток пассажиров и стал что у них некоторый дискомфорт был в деньги да окей ну по сути у нас наверное есть какая-то средняя стоимость одного билета которые летают люди и если у нас там говоря на на десять процентов меньше

    00:30:59 - 00:32:21

  • пассажиров там не знаю там и рту и стала то можно наверно среднюю самый простой наверно нажать на среднюю стоимость билета на как ты узнаешь что тебя стала на 10 процента меньше ну мы же собираем его наверно данные о том сколько у нас пассажиров летит в одну дату сколько абсолютно другую дату то есть такие вот вещи посмотреть ну как бы да наверно тут еще нужно было начать с того что ну да какую метрику оптимизируем также хидан и на вообще доступны данные ну в принципе все об операциях компании в том числе то есть мне ограничен по

    00:31:43 - 00:32:59

  • сути все что можно придумать там да но до 3 называя буду говорить можно например у нас есть же данный там про количество мне возможно очень понятен вопрос про про то что откуда мы знаем почему у нас стал меньше пассажиров на мы знаем но как можно нанять что количество меньше пассажиров стало то что нас к вид случилось англии потому что вот этот самолет на 30 минут задержали да это хороший вопрос то есть нам нужно отделять именно причину того что пошли именно потери у нас в результате того что самолет задержался либо взять того

    00:32:22 - 00:33:35

  • же любых других каких-то внешних еще причин ну я не знаю насколько уместно этого авиа краски перевозках можем наверное будет не очень на наши хорошо метрики там текущей топ-менеджер нам другого лет не одобрит мы можем провести такой тест что задерживать какие-то самолеты и пускать их там задержка и отправлять нормально потом померить хотя да тут и смотреть именно на тех наших пользователей тех пассажиров которые летели задержанными рейсами насколько они к нам хорошо возвращая самом деле правильно только нам не нужно делать

    00:32:58 - 00:34:19

  • этот эксперимент у нас же есть исторические данные с программой adobe дома не могут отследить там вот в прошлом году этот человек задержали на 30 минут насколько режу он стал с нами летать в следующем году да да точно как к этому более с более сложным и тебе подошла им то есть принципе мы уже можем оценить выдать потери от дискомфорта пассажиров просто понять насколько реже у нас пассажир начинаются нами летать если мы задерживаем том числе там смотреть можно бизнес пассажиров отдельно потому что

    00:33:39 - 00:34:35

  • они слишком другие цен на билеты и так далее да хорошо мы поняли что по 1 компонента вот этих издержек это у нас дискомфорт пассажиров который мы принцип поняли как можно теоретически оценить что-нибудь еще в этих издержках будет да то есть так как мы клиентская компанию да мне кажется первостепенно у нас именно пассажирский это что у нас уменьшать клиенты также можно посмотреть на на метрики которые касаются наверное какие менее значителен например у нас больше наш персонал наверное работает больше там обслуживает а персонал

    00:34:06 - 00:35:23

  • который там обслуживается или это не совсем нет это значит лера кондра здесь пока сами просто про пассажиров только поговорю . сожрав про персонал там больше когда накапливается они будут зависеть от многих рейсов и есть там один резкий рост налич его если несколько тоже там переработки оплачивать зависимость определенных рамок потому что у них смены то есть 1 рейс пассажир наверное можно не учитывать пассажирский ну как я вначале говорил репутационные риски ты сбежал от репутационный в принципе уже тут оценили

    00:34:45 - 00:35:44

  • то есть что еще именно касаемо пассажиров и может существенно повлиять на наши нашей вине прибыль так надо подумать но ты пассажир тебя задержали если ты никуда дальше не лети штата принципе если да если у тебя есть пересадка данных на другой рейс другую возьмем допустим да и очень часто это кейс авиаперевозках когда тебе нужно в какую то там далекую страну улететь у тебя нет прямого рейса ты там или допустим более не ждешь его взял билет из того рим сначала в рим потом там в рио даже нейроэлемента так и ты опоздал на вот

    00:35:15 - 00:36:38

  • это вот свой перелет из рима в рио-де-жанейро соответственно ну ты понимаешь что падаешь ты возвращаешь как бы билеты ну или как настроение возвращаешься авиакомпания должна обеспечить перелет потому что у него купил контракт с пресетом стокгольма бреда жанна окей да тяните должны обеспечить с юридической стороны если это так итоге да то есть компании два раза платит за перевозку пассажира то есть как бы удвоился тоже касты на она должна либо покупать билет у конкурентов либо договариваться со своим альянсом там

    00:35:56 - 00:37:02

  • если стану искать им альянс это увеличение как это можно назвать просто издержки на выполнение пересадок ли там те кто потерял перед значение вынужденных пересадок то есть это основные да если у нас уже задержка большая там европе больше трех часов он то есть такие евро flames можно до 300 долларов евро с авиа компании потребовать но это если уже задержка на трех часов то есть группа серьезным свисали до можно вот этот у нас издержки да хорошо что мы про них поговорим скорее всего попозже пригодятся но при начале у нас

    00:36:29 - 00:37:46

  • задача была просто там чуть поменьше пока как нам прогнозировать вообще задержки именно задержки там в минутах да тут и думаю важно вернуться к данным которые у нас могут быть собранным ну там расписание авиакомпании я фактическое планируемая за последние пять лет в том числе конкурентов но и какие-то данные там еще дальше спрашиваю посмотреть расписание этих рейсов соответственно у нас есть я так понимаю в каждом списание то есть там все временные фичи то есть когда он когда самолета насколько приземлился на сколько там

    00:37:08 - 00:38:33

  • припарковался во сколько на планируемый год эгоу да то есть такие вещи я думаю как бы тут можем сделать что-то вроде нужно поговорить про фичи который у нас есть у нас есть вот все же со временем во сколько там вылетел наверно у нас есть данные там у самих самом этом авиаперевозчики то есть какие-то может быть микро макро там фичи сколько у него общи в среднем улетает рейсов в день сколько сколько ни на танке химию самолеты какая вынести сколько самолет были осуждены какой был самолёт какие сколько

    00:37:54 - 00:39:33

  • пассажиров на рейсе где то конечно для себя мы знаем точно для конкурентов там примерно про самолеты то есть их совместимость достигнуть но и предположим пока что для простоты то что наши клиенты мы сейчас делаем пилот только на одном типе самолетов интересует 737 на 700 до ok то есть на одном типе самолетов возможно нас есть данный про и рапорт просом но у нас много аэропортов да у нас есть про них то что аэропорт здесь расположен да ну тут нужно наверное собрать максимальную возможно общей информации который мы

    00:38:43 - 00:40:00

  • можем достать бро про то что у нас с и рапортом самолетом может быть просто газ понять нам нужна какая-то информация нет потому что там понять девушка информацию можем достичь достать часто это либо время либо деньги либо и то и другое то есть мы решаем а посадить нам этого аналитика не зная недели вот эти данные преобразовывать к нужному формату или нет да это хороший вопрос про ценность обще данных того что мы можем не можем достать наверное тут можно делать какой то при услышала со всей сейчас никакого

    00:39:25 - 00:40:39

  • этого типа данных вообще нет стоит ли вообще начинает собирать тратили на это ресурсы тут собственно нужно наверное допустим построить китобойное модель изначально вообще исходя там из минимального набора данных то есть что вот у нас я бы временным каким-то промежутком там какой-то вот предсказание там временного ряда грубо говоря до с тем во время полетел элементом minor нотификации сделать самолетом посмотреть как вообще качество выдает на этом да кстати я забыл спросить возможно в авиакомпании уже есть какая-то своей

    00:40:04 - 00:41:28

  • модель может быть не имели экспертную который пытается тоже это прогнозировать исходя из каких-то факт низкое качество или мы как бы с белого листа начинаем меня есть эксперты которые там по 40 лет работает в этой компании как-то делают расписание принципе с ними можно советоваться там что они используют но там какой-то формализованные модели либо метрики качестве то есть метро текст они стали вообще придумаем омской ну да до этого не нужно было окей да я понял ну тогда мое предложение это построить с

    00:40:46 - 00:41:46

  • чела модель базовая модель посмотреть как у нее в качестве получается можем ли мы вообще как-то прогнозировать то есть если какой-то удовлетворительным качеством хорошо семь процентов рассказали верно так мы с данными получается расписание там самолет аэропорт довести мое доброе работают что-нибудь еще вот такой вот важное для возможно какие то не знаю макроэкономические показатели мы тут соберем то есть что там но для задержки конкретную рейс номер надо это не даёт гире сетки и ложки по воробьям уже до начинается

    00:41:16 - 00:42:34

  • дададад атаковать что именно влияет самолет сильно так ну все что касается самолетов как бы у нас есть уже рапортов и какую-то еще возможно погода да да погоду ну потому что как ни крути от погода даром вода может очень сильно задержать любые рейсы но вот допустим этих речей принципе для нам достаточно а что ты будешь предсказывать да ну как я вначале сказал облезлой модели что у нас есть временной ряд там ну это не такой классический временной ряд то есть у нас самолеты не стартует там с одинаковым

    00:41:57 - 00:43:12

  • промежутком времени там то есть не каждый 30 мин старту это у нас как бы до есть станешь темп в которой самолет вылетел и допустим и свеча опоздал на линии плюс к этому то есть это как бы сам простейший вариант это просто бен одну классификацию и полетел вообще или нет в правильное время плюс к этому можно как бы регрессию сделать на то что насколько он тайно арно регрессию какая у него задержка была минута а ну да то есть прогнозируем до задержка рейса то есть это целевая кого перемена начиная задержка данного самолета

    00:42:35 - 00:43:55

  • монтировать потому что в итоге там где три оптимизации хочется на тебя насколько он задержится насколько это будет нам стоит потому что например при расчете твоих вот этих то что мы выделили как издержки там же красный пассажир он тоже важно том числе и точки зрения reporto репутация компании это задержка на 5 минут и 40 минут но мы естественно нужен для пересадок тоже как понять человек теряет пересадку либо нет вот та твоя прогнозируем вот задержку в минутах самолета как как ты считал эту переменную то есть

    00:43:15 - 00:44:23

  • какую бы формула проста простой еще как ты будешь считать задержку для на исторических данных ну по сути этого плана минус факт завоеватели за то есть в итоге у нас план минус фактической иштар гида на и ты будешь targeted обучать до сути так то есть у нас будет а ну хоть что никак минусы будут ну тут можем как бы дать модуль но у либо факт нас есть это время время в минутах ну с этой да у нас то есть классической задачи как бы на табличных данных считать наиболее хорошую с наименьшей ошибкой минимизировать это вот

    00:43:50 - 00:45:37

  • если смысл как-то поменять эту переменной бы лучше я предсказать раз хотел надо говорить зависит от того какой у нас тип модели будет то есть что каким играющего до тип moderate исторически нами когда мы считаем вот колонку наши таргет там панда что самое первое что хочется делать это просто смотреть во сколько фактически самолет прилетел вычесть и сколько он должен был искать что то это вот задержка конкретно этого рейса но как должны были понятно бизнесу не были когда ты там уже упомянул то что если у нас

    00:44:44 - 00:45:50

  • там задержали один рейс у нас в конце может все это повлиять на остальные рейсы и если мы бы не уберем вот это вот влияние из нашего таргета там и получать скорее все будем предсказывать какой-то шум если мы не будем знать что-то прямо виду завис как нам раз паразитировать торгует чтобы только задержку именно нашего рейса учесть видим он-то должен учитывать какой то вот это вот накопившуюся от предыдущих итоговых вылетов тоже ошибку чтобы отделить именно свою от чужого тут какой-то видим до нужно

    00:45:19 - 00:46:28

  • математическую формулу которое будет учитывать предыдущего униформу скажут нам что тут надо добавить либо вычесть а чтобы вот этот скорректировать она у нас есть просто кумулятивные допустим накопленную ошибка задающий то минус этих там какой-нибудь лорда как то соответственно да будет факт минус план и минусы тошиба которым из предыдущих надо просто время разницы времени прибытия предыдущего рейса с планированием время предыдущего рейс по сути опоздание предыдущего рейсом то есть это фактор гид нет ни лакота то

    00:45:54 - 00:47:12

  • есть если мы задержали первый рейс и он все предыдущие задержал то реальные задержки предыдущих рейса будет 0 каждый из них на нас будет корректировать на то что первый рейс а это именно этот план минус факт предыдущего рейса ну в общем нам нужно сохранить эту переменную предположим что мы из воды считаем вот этот вот таргет какие модели применял на что смотрел да ну соответственно так у нас данный табличный я забываю спросить какой объем на верность данный будет то есть ну pandas потянет там за пять лет

    00:46:35 - 00:47:49

  • расписания 1 учит его что у нас один тип самолёта пока что да и на авиакомпании туда наверное не супер много и мы можем использовать эти данные также орехи в других авиакомпаний на других типов самолетах осмотреть порядок данных который вылезает у перцов надо выиграть его mehdizade ну значит и самый там простые базовой моделью можем построить там линейной регрессии там что посмотреть просто есть у нас малых вещей там какие-то может быть линию даже зависимые от нашего торги то есть есть то можем

    00:47:14 - 00:48:32

  • там строить сам про стоит ли вин регрессию там потом переходить более сложен там с ансамблем то есть допустим из коробки и возможно просто хорошо заработать там rainforest и для такого более уже продвинутый вариант когда мы хотим понастраивать там починить параметр это будем кредитный бусинка использовать допустим так возможно там так как у нас ну какие то более экзотические модели я не знаю стоит ли пробовать общее тратить на них время может быть не отдавать так она этих стадом за а какие потери бы то есть функцию потерь

    00:47:52 - 00:49:05

  • какую использую надо ну самое первое что для этого напрашивается как у нас просто регрессии мы можем как бы мск туда делать то есть модельки то есть и какой как мы вас то есть наверное первое что то напрашивается панаса мы так это же понятно но тоже своими наверное может быть каком из я работает ну можно сказать но это по сути то что мы запретили минус фактическое фактически фактическое значение как бы в квадрате у вас функция ну и и плюс в том что дифференцируемы то есть ее можно между нами гридина спуска хорошо считать

    00:48:29 - 00:50:01

  • отображать вот наверно можно что-то еще более применимы и к нашей задаче то есть есть там всякие там мой этом в об этом такие штуки мы можем на самом деле посмотреть просто на разных [музыка] как сказать с разными вас функциями насколько хорошо у нас это будет принят предсказывается где-то с точки зрения бизнеса нам как лучше потери смотреть к что они квадратично оценивались или линейно ну с точки зрения с точки зрения бизнеса и munsu бы конечно по непонятнее когда мы допустим вот абсолютно новым

    00:49:18 - 00:50:40

  • считать ошибку то есть что просто у нас был план вот факт и вот какая разница но бизнесу мы наверное будем это то что как бы для нашей модели используется чтобы она сама ваша обучилась потом мы можем уже на основе и ошибок бизнесу какой-то более понятную метрику вывести чтобы уже они тут помню то есть у нас е плюсы в том что дифференцируема и минусы в том что она сильно будет этих стал флаеров выстреливать и давать возможно то что мы хотим соответственно моей таких краски на более с со флаерами

    00:49:59 - 00:51:24

  • более приятно работать но она не гладкая то есть с ней есть может быть обучаться модель будет быстрее лучше и а как ты будешь мерить качество уже вот обучил какую-то модель на удастся соответственно да тут важный важный момент перейдем что надо как-то этого лидировать то есть у нас есть и причем к этому довольно ответственно подойти потому что я так понимаю у нас может что-то стереть все посмотрели уже какая у нас задача и поняли на то есть именно раздел по валидации [музыка] по сути что что у нас тут у нас есть

    00:50:42 - 00:52:21

  • четкая времена компоненты то есть что мы в во времени мы там по предыдущим нашим рейсом там данным они попытаемся предсказать наше будущее рейсе соответственно тут нужно сплитить делать этот курс соблюдаться с учетом временной компоненты то есть out of time делать валидацию и соответственно это моё главное что надо обращать внимание плюс может быть разбивать не только по времени но и по может быть каким-то типом снуда нас один тип самолёта допустим если мы там каких-то более более большой выборки данных это смотрим

    00:51:34 - 00:53:03

  • то разбивать не только по времени но и там по самолетам типом чтобы грубо говоря не обучалась на чтобы у нас в украине не было только одного каких-то одних типов самолетов валидации они совершенно другие соответственно от следить за тем чтобы было это не было дистрибьюшен шифта то есть распределение были однородный на на троне в тесте а ты бы делал одна модель на там все аэропорты все типа самолета были там может быть разбить на несколько моделей а ну да хороший тоже point что мы на самом деле возможно какие-то дам если будем все

    00:52:23 - 00:53:46

  • сразу сегодня в копам обучать его лидировать то не учи там какие-то нюансы до конкретных типов самолета конкретных типов вылетов и соответственно мы можем множественное тестированию стоить то есть как бы по каждому вот разделить на группу да опять же там допустим типов наших там самолетов типов аэропортов может быть может быть там по географическому признаку делить что там и те самолёты которые там ультой другого рядом в америку те кто его летают этом базе вот как-то так же разделить максимально такую вариативность проявить

    00:53:04 - 00:54:28

  • а как ты думаешь для каких из этих моделей будет важнее теоретически болезни разделить на несколько групп и для каких скорее всего без разницы да окей как мне кажется более скажем так модель которая более всего чувствительно будет к с кем так печам из разных распределение то есть если линейной регрессии потому что у нее более ну а в ее сути и определение заложено предположение а как бы линейную и зависимости от свечей вот и там они все вещи должны быть как бы взять хоть и заново распределения в случае он сам

    00:53:46 - 00:55:11

  • любых моделей ну случае random forest умника рацию так как он модель кто просто из коробки хорошо работает она наверное можно как генерировать она всю выборку потому что там рандомизированы происходит в строении там деревьев и соответственно они могут там на разных кусочках строиться там и давать тысячи деревьев устроим там 10000 деревьев и из овец может быть у них будет более такой меньше смещен с ними не смещенный будет результат прогноз вот с кредитным бусинкам вопрос такой боли дискуссионный

    00:54:28 - 00:55:41

  • то есть там он поражаться хорошо [музыка] просто вот мы сгенерировали модели на хорошую работу пересказывает одно число прогнозирует нам появился девушка нам надо предсказывать на самом деле ни одно число а какое то распределение потому что мы хотим там появилась применить monte carlo simulation нам нужно генерить сценария и для этого нам бы хорошо иметь чтобы наша модель предсказывала ни одно число от тела и распределение того как у нас возможно будет вести себя задержки то есть и мяч ведунам таргет

    00:55:04 - 00:56:27

  • брать не не просто до предатель от распределения конкретном после завтрака квот на этом рейсе амстердам париж какая у нас будет задержка прилета хорошо просто есть нам нужно как-то уходит агрегировать много много полетов в одном дней какой-то средний выходит считать нам даже надо не средний ни одно число 1 роста распределения чтобы потом из него могли брать и генерить какие-то сценарии ну это прям до интересный вопрос надо просто быстро идеи там любая любая несколько дней ну мы можем строить на

    00:55:52 - 00:57:09

  • самом деле много моделей народных как сказать на разных типов сэмплах и как бы выдавать их то есть целый много [музыка] предложений об этом со средним каком-то средне задержки в итоге у нас будет к этому instagram к с тем что насколько как-то больше генерить много значений по сути это много много моделей разрывали образным модели ком народных под множествах обычных раскидать на хорошо теперь предположим вот у нас есть вот модели которая там возвращает либо одно значение либо либо там целое распределение

    00:56:31 - 00:58:02

  • как ты думаешь как нам имея вот эти вот данные за день там либо несколько дней до осуществления полетов применить их чтобы уменьшить ожидаемой задержки то я сейчас чуть расскажу давали когда компания работает они за день до то есть они сегодня на завтра там после завтра после послезавтра делают планы какой конкретный самолет будет выполнять какие рейсы то есть сами рейса не придется там закуп полгода либо даже больше вот то есть дата что там в 15:35 из шереметьево полетит самолет на мастер дам но то какой самолет конкретно

    00:57:16 - 00:58:30

  • какой борт будет выполнять этот рейс потому что их там это 50 на 50 одинаковых самолета допустим авиакомпаний она решает что это вот конкретно вот этот борт будет выполнять вот прессе это решается примерно за день можно ли как то вот на этом этапе когда у нас уже определены конкретные мы не можем менять время конкретных вылетов определяет свойства только самолетов все самолеты одинаково типа не допустим они все одинаковые там ну то есть технически особенность не будем учитывать что какой-то может чуть быстрее лететь

    00:57:54 - 00:58:54

  • какой-то медленнее это опустим там иногда конечно компании специально догоняют в воздухе если там позже вылетели можно ли вот на этом этапе как-то зная ожидаемые задержки сделать вот этот назначение бортов на конкретные рейсе так чтобы мы минимизировали задержки по сути у нас ты говоришь мы не берем характеристики самолетов но у нас есть про каждый самолет какое-то предсказание о том насколько он среднем задерживается самолет задерживается или то есть мы вот здесь вот что прогнозировали задержку

    00:58:24 - 00:59:28

  • секретного резину конкретного рейса разделения рейсы сюда то есть самолет ну самолета все одинаковые на тип самолёта то есть мне почему внимание на зависит и самолета вот у нас один тип самолета он все они допустим летают возможно это же нет конца понял бы мы из нас одинаковы самолета нужно подобрать какой-то из этих самолетов который полетел полетел бы вот в это выбранное время где у нас есть прогноз задержки нет рейсы но нужна она же все одинаково да все самолеты одинаковые да но можно ли назначением именно рейсов на самолет

    00:58:56 - 01:00:05

  • и сделать так чтобы у нас задержки ожидаемый были меньше то есть пример пример так это знак из б о в ц и допустим у нас из шеф а из допустим да и мы прогнозируем что вот этот вот рейс но у него распределение задержек будет какой-то топор и у нас там соответствии с какой-то минимум ground той которая нам нужна bobst удержать с одно мы уже видим что 10 там прогнозируется большая задержка то есть скорее всего вот этот отрезок будет задержан вылет его будет задержан есть то что ты сбежала то есть мы просто

    00:59:31 - 01:00:58

  • подбираем другой самолет чтобы он вылетел из этой точке потому что этот не может из того что его долго обслуживают и сложного нет того что она казалась данное слово это стандартно идет можно ли как то вот здесь вот поменять вот это вот распределение чтобы мы меньше задержали рейсов а ну используя то что у нас есть какой-то наша оценка на задержку вот это допустим рейс из б.в. то есть вот это например у нас там самолет 1 ну это мне flight на самолет 2 можно ли здесь что-то это у нас на расписание на завтра

    01:00:21 - 01:01:29

  • можно ли здесь что-то поменять чтобы у нас уменьшилась задержка ну естественно туда - первое что приходит в голову это когда он мы видим что на этом лесе нас величина задержки большая мы можем просто поменять на тот ну то есть понять что он приезжает позже мы просто меняем его вот допустим на этот самолет который вот с меньшим прогноза то есть какое-то расписание будет для вот первого самолета называет ты там рейс 1234 ну то есть я могу просто поменять из овд чтобы они за фцп полетел а ну да мы можем на самом деле просто до

    01:00:55 - 01:02:10

  • переназначить вот это вот первый первый рейс [музыка] поменять что что после него как бы летит то есть не 2 леса вот допустим этот третий который был раньше допустим с меньшей задержкой сейчас но я неправильно понял не знает во что после первого не 2 o 3 на 3 у нас рейс начинается с c а второй шанс и телом смотреть вышел на лед во времени во времени один рейс один самолет неясной вот это вот это называется то что фрит line то есть вот это вот один самолет он приносил что на самолет один он выполняет 1 2 самолет выполнять 3 4 и

    01:01:32 - 01:02:51

  • допустим ко второму самолёту нас ожидании его задержки меньше чем к первому но у даже на соответствие мы когда прилетает первый самолет него 2 только самолета а у третьего рейха тоже ожидания на время задержки мы прогнозируем на уровне рейсов окей ну так как летел первый рейс мыс прогнозирование во большое большое число задерживать задержки до соответственно у нас есть допустим вот этот рейс номер четыре который уже след а раньше мы думали что он против д но так как мы видим допустим это по времени

    01:02:12 - 01:03:25

  • дольше чем через больший промежуток времени он должен устроить дыму соответственно этот рейс просто меняем со вторым местами даже такой 2 лечит is off да из а в б они fci а как автоматизировать вот эти вот замены есть какие-нибудь идеи anti-age там можно смотреть руками где ну да да это неудобно вычитаю начну там тысяч через каких-то на средства мы можем сортировать как-то наши отправление там по этим по большим задержкам и ну то есть на какой-то минимум оптимизационных задач ударили по общий суммарный минимизации задержки

    01:02:48 - 01:04:19

  • ящик или чего мы будем минимизировать задержку отправления зачем нам минимизировать задержку этим обозначенным ранее такая загодя имеют потерям и другом оптимизируем и соответственно нам наверно нужно просто большим приоритетом убрать рейсы который там с большей спрогнозируем и задержка отправляется и такой скажу так жадный алгоритм надо сделать чтобы он по по величине потери подыскивал наиболее подходящего кандидата соответственно и перетасовывая рейсы искать этом из прогнозируемые задержки там их менял

    01:03:34 - 01:04:56

  • местами то есть сделать такой список ну как-то мне видится на в подъеду мы еще это конечно надо будет протестировать можно на исторических данных каких-то пять протестировать насколько бы изменились потом общее задержки бы мы решили эту задачу возможно уже далеко забегают а как быть с тириона исторических данных да ну выходи туда применил это вот мой алгоритм и соответственно она у меня не будет истинных как бы истинных полученных задержек после этого мы его применения что тебя совсем другая расписанием

    01:04:15 - 01:05:31

  • случилось в прошлом тут наверное может подойти какой-то быть с аэропортом в груди рапорте мы запустили то это достаточно сложно потому что расписание взаимодействие взаимосвязано 1с да здесь как раз и поможет вот этот monte carlo simulation у нас есть распределением и генерим кучу сценариев задержки и смотрим какие у нас теперь в каждом из сценариев задержки думаем что там средний китаец больше чем был до в оригинальном расписаний например дакия просто for затем этом знакомы знаю там 7 систем природе когда там

    01:04:56 - 01:06:05

  • последовательности наверное что то то есть марковская цепь похожие да только без то есть просто как бы сценарии много и смотрим где средние значения какие ваших целевых параметров там ну да интересная задача хорошо тогда тарновский сам все твое время задавать вопросы да хорошо ну как бы наверное интересную в целом про про то наверно ты мне рассказала бы больше часть того как вы это решали до 0 и 6 до 20 интересно просто если это не идея то насколько сильно вы помогли этими рапортом увеличить там свою

    01:05:30 - 01:06:55

  • авиакомпаниям увеличить какой то прибыль там смерти снизить издержки цифры достаточно сильно цифра не помню наполненные тебе есть тролли где там и называются какие-то цифры которые можно называть поэтому чтобы не соврать не буду ничего хорошо я так понял ты в основном да именно на тему my перевозок был пятьдесят на пятьдесят то есть это do mundo к вида как раздай авиаперевозки после этого салят стремился фокусу с того что авиакомпаниям стал достаточно тяжело но мире не так много перелетов когда у тебя не так много перелетов нет

    01:06:14 - 01:07:25

  • смысла и так сложно что добра за сиротинская видом на да поэтому да и я начал делать как раз проекты связанные с промо оптимизация и анализом промо с точки зрения поставщика с точки зрения ритейлера таки морж подробнее рассказать как вас происходит именно внедрение этих решений в про то есть наверное вы же не получаете полный доступ к заказчику то есть к его системе там какой-то админской штук чтобы прямо на которой таких профилей вам прям так доверяют что нам доверяют не то есть мы получаем доступа естественно мы не можем

    01:06:50 - 01:07:56

  • ломать продано у нас есть возможность также как этой компании выкатывается другие модели дать свое модели они ее выкатят возможно там что даже с большим приоритетом потому что большая важность проекта обычно да то есть разделаются модели там что-то машин леоненко вы какой-то оптимизационные чаще всего упаковывается там toker контейнера делается какой этот бег делать это делается фронт если что это все прям аж ребята в команде делать то есть они ответственным за полную выходку да она логически то есть там

    01:07:23 - 01:08:21

  • нужны не только компетенции в области достанется тому как правильного лидировать на дорогу до у нас в гамме есть несколько отделов организации буквами гамма сеток раза больше на на гамма consultant есть гамма x это больше там software data инженеры которые мы имеют и 5 сделать волна люкс да да есть дополнительно уде которые делают юань там либо простой то ее с помощью табл он почти как power bi power bi ну вы берете того чего надо скорее всего да и то если что-то простенькая там как даже барби сделать например который

    01:07:52 - 01:09:02

  • рассчитывается на основе исторического анализа если что-то сложнее где user должен что-то вводить смотреть кликать то уже там полноценный фронт нам сейчас на реакции например делаем на этом для авиалиний нам гуляли делали вот и соответственно дело mind and windows да да да это все так же с помощью команды клиента там сначала начинаем сами потом периодически люди со стороны клиента добавляются это помогает и потом отдать им просто продукт и данный клиент например издержки меньше если мы скажем что ok давайте нам вашего более дешевого

    01:08:27 - 01:09:31

  • front-end developer нескольких интересно наверное побольше части выходит международный проект и мин долгам зависит то есть здесь аят отрасль с twin металлургия то это риторика ресурсные да это россия но на самом деле ресурсные там и в африку летали и сейчас там тоже с африкой и удаленно проект есть там азия то есть здесь понять дело что на российские проекты тяжелее найти люди из за рубежом потому что есть языковой барьер но туда попасть я так понимаю вот этот кисть такой это июне к какой-то пример того что вы можете уже кандидата

    01:08:58 - 01:10:18

  • спросить когда приходит за то что можем за youtube выложить то что я спрашиваю кандидатом естественно здесь не спрашивала программе с точки зрения кейс раскрыта в целом [смех] там очень верхнего уровня потому что все меняется я за этим сейчас не очень сильно слежу это больше лучше начале вечера спрашивает а сначала идет тест это на два часа coding тест онлайн он код челлендж такой сайт там проверяются основной там питон либо другой тон возможность манипулирования данными с построения модели оценке моделей

    01:09:42 - 01:11:05

  • какие-то там вопросы с выбором ответа на статистику например и какие-то mob in queue шанса посмотреть как какой-то задачи вы человек подошел чтобы велкам что может быть причиной этот тест оценивается человеком то есть там если даже ждет опечатка там может быть не так страшно потому что человек проверяет смотреть ли логика правильно это все хорошо после этого несколько либо одно там зависимости от ситуации технических интервью типа того что у нас с тобой было где уже с проверять не только технические знания в отличие от

    01:10:26 - 01:11:30

  • этого coding теста но и там счета бизнесовая можно и pro software engineering design нужно присутствует при жрите залить или скорее не к вам это зависит от опыта человека зависит от опыта человека но есть если у человека большой опыт во внедрении модель конечно можно спросить тоже как нам полезно у нас у нас команда небольшие часто приходится все делать самому вот и здесь соответствие немного operational research можно спросить прямой бы ground он был чисто пересечь ее вот этим занимался стримы с

    01:10:58 - 01:12:06

  • предсказанием прогнозируем там другие люди делали вот после этого идет в том числе будет одно классическое интервью то есть просто консультант к интервью и дальше еще по моему тоже несколько интервью уже такие более finer как дома тоже нас миссия между бизнес sens и технических то есть то мужики это уже руководством более машенька но это зависит от доброго больше он должен не знает что но более сеньор да то есть но не знаю то есть они будут похожи скорее на что то типа того что у нас было с каким-то кейсом только более верхние

    01:11:32 - 01:12:49

  • уровни вы бизнесовый гейз не понял одним словом меньше технических деталей скажем так далее так понял что ну как такой миф наверно был раньше про консалтинговые фирмы что там со мной весь этот разработка там в целях там идет что клиент какой то стоит регрессе кидают такого нет у вас но уже нет да и кроме вся и даже в обычном консультанты в кроме экселя пришел уже на смену аль тирекс там табло для анализа данных то есть они уже вполне могут большие объемы нет ни пор пульт ду ма да да да именно некоторые консультанты отличную пишет ее

    01:12:10 - 01:13:22

  • склеили запросы и какой-то скриптик на питание могут сделать что мы сами проанализировать данные можно им отдать какой jupiter ноутбук подключенный к базе данных и они уже сами играются смотрят какие-то выгрузки нужны себе делают ну хорошо ли бо дыль 100 мы знаем сам не либо послана чтоб они сами копейки напрямую запрашивали пока у нас фронт не реализованы ну короче все живут до приходится [музыка] как фильм так нами у нас было две части одна более к софтовая рассказ и второй это кейс про софта бы мне кажется стоит чуть

    01:12:46 - 01:14:15

  • поработать над вот этот фид частью например там рассказ о себе то что ты проходишь какие-то еще курсы где-то учишься мы узнали там больше ближе к концу до перевала перед камерой забыл рассказать обычно да да то есть как то более чуть более полная история чтобы было там что ты вот учился работал сейчас там сам ким балета очень классно то что сам обучаешься там ходишь и в том числе не только через интернет ну и специализированные курсы потому что как бы ни были хороши онлайн-курс все равно когда есть

    01:13:36 - 01:14:39

  • какой-то учитель ментор которую можно спросить это всегда помогает и и ускориться и где-то и сделать свою ошибку который потом выше повторять также направо под работы про проект сбербанке то есть возможно как стоит перед структурировать рассказ на что я не сразу понял в чем твоя роль что создали глобы да то есть здесь ну либо глобальные как ты там это боль лучше артикулировать здесь вот я чють чють запутался поэтому там тоже спрашивал наверное профит части это все так принципе хорошо искал интересный проект

    01:14:08 - 01:15:25

  • про просто кейс особо на самом деле замечаний нету понять делать до что чуть пришлось там помогать где с разве например вот бы про это наверное этот момент с тем что переносить резь наверное мне бухгалтер но когда то есть где-то подскажем как мне кажется больших проблем не было там с технической частью тоже там спросили вот на на самом деле протеста наверно нет больших комментариев не будет там кита майнер моменты на самом деле меня был довольно довольно такой новый новым опытом и вот именно минский

    01:14:47 - 01:16:18

  • в привез какой-то там области я как-то вообще когда шяс я думал будь что ты именно вот такой про внедрение про то как это чувствует себя там в кой-то может быть системе большой но надо было сделать в голове такую поправку на то что и sygic окраски больше с такими наверно клиентами в реальном мире больше internado работает ну или наверное на утверждение нет она зависит наверное какие то том числе от рынков возможно здесь то что там люди к верни компании которая уже а там большие сами в интернете у них уже какая-то аналитика

    01:15:34 - 01:16:43

  • есть своя ниша можно настроенным либо меньше надо либо им надо другое ну по сути скруток в интернете легче собирать данные там всех чем каких таких компании тоже есть система достаточно здесь свои нюансы нувоки нами спасибо так интервью подошло к концу хотите принять участие в следующем эпизоде пишите на почту youtube собака плюсе британ . про с пометкой нанята участник поставьте лайк пожалуйста и до встречи по ту или по эту сторону ящика [музыка]

    01:16:08 - 01:17:35