Подготовка к собеседованию на Data Scientist
Менторы
Специалисты своей области, которые смогут помочь вам
Middle .Net Developer
Senior Product Manager
Middle Python Developer
Ведущий программист
Backend Software Engineer (PHP)
Senior .NET/C# developer
Middle DevOps Engineer | Tbilisi, Georgia
Middle C# .NET
Senior PHP-разработчик
Middle python developer
Каналы
Полезные Telegram каналы и чаты
Транскрипция видео:
так ну привет всем да сегодня мы проведем очередное типичное собеседование сегодня у нас качество собеседника скажем так это юлия скажи привет хотя бы вот сегодня мы соответственно проведём некоторое интервью в формате приближенном максимально к боевому в нем мы поговорим про м.л. да соответственно про вопрос связан с теорией также мы поговорим про опыт вот кроме того мы поговорим про технически уже соответственно скелеты конкретно проверим знания с керри и питона и в конце попробуем разобрать например
00:00:00 - 00:01:24
резюме более подробно я чуть-чуть подчеркнуть что юля следуется на позицию видел то есть они там жора уже более высокая позиция вот ей уже из соответствии с уровня мы будем заливать вопрос последняя будем давать дадим задачку на пудинг такую нестандартную где юли придется там подумать как я жить в режиме реального времени вот хорошо давай тогда юль начнем с тебя расскажи немножко про свой опыт вот чем занималась какие задачи решала что хочешь вообще найти да я вообще экономист по образованию вывод и когда училась работала
00:00:41 - 00:02:20
продуктовым аналитиком воды когда работал аналитиком собственно поняла что мне очень интересен ds и хотел развиваться в этом больше и после окончания этого года но сейчас к сожалению у меня искать но вы работали поэтому я сейчас активно тренировать собеседования и развивают больше для собеседований чтобы найти и как я понимаю ты еще идти выше и следование на английском помимо того что тебе нужно тренировать хотите вы тебе еще нужно это подавать на нам известную науку на неизвестном языке хорошо
00:01:31 - 00:03:08
отлично а вот и втб какие задачи решал а вот туда это были задачу кредитного скоро они довольно просты и то есть если по моделям этого логистическую регрессию потому что там требовала нет интерпретируем асти данным там больше про анализ данных было потому что до обработку нужно большое сделать вот так как этот дисбаланс классов нужно было и почти все данные там и и сделал так чтобы вот эта проблема была проблема того что из требований отобрать не все вещи которые есть а только как можно меньше но качество что было как можно лучше вот
00:02:19 - 00:03:31
и собственно вот эта проблема решалась с логической агрессия с методом насколько кстати признаков используя с модели ты говоришь что занимался быстренько модели несколько обычно шло признаков функциональную модель которую же являлся интерпретированы а около 6 5 признаков того как [аплодисменты] хорошо касаемо предобработки что вы соответственно там берут данным но так понимаю наверно не грязные достаточно был доволен какие-то на здравый смысл проверки что возраст не больше than 100 лет а вот какие-то такие штуки пропуске
00:02:55 - 00:04:18
обработайте вот тоже корректно но в основном чаще всего это замена значением типа минус 9 9 9 и вот но разные виды пропуски разными видами значение 80 а в зависимости от вида пропуска разные за чего-нибудь заменены наверное еще какие-то преобразования совместно например там возраста может там просто фичеринг надо решать и такой я сходу не совсем про ds вопрос но вот как ты объяснила что такое fitch инжиниринг в одном предложении когда вы берете имеющиеся признаки делаете из них какой-то новый признак
00:03:51 - 00:05:13
комбинации первый раз при этом лучше версию не назовешь новый чуть-чуть еще немножко подумаем какие условия там должен в моляться ну то есть какие мы хотим условие чтобы на новый признак выполнялись чтобы он был более полезным чем предыдущие сделать лишь ошибку то есть повысить признака пространство тем что сделать меньше ошибку и повысит предсказания нашего предиктора это признак должен быть более информативным для нас вот крыша еще раз того тогда теперь с учетом этого дом приложения преобразования существующих признаков
00:04:38 - 00:06:03
новые комбинации сделав их более информативными супер отлично теперь теперь идеально хорошо давай тогда мы начнем с технических навыков вот начнем из питона да то есть у нас есть задача у нас есть неотрицательное число например там 0 1 2 3 и так далее его надо округлить до ближайшего большую сторону числа кратно аппетита есть пример 0 управляется 0 да потому что он по сути каротин вот соответственно 2 до 5 и 12 до 15 и так далее так далее такая задачка давай сначала прежде чем начать писать давай попробуем с тобой как-то
00:05:20 - 00:06:50
проговорит алгоритм какие функции чего использовать будешь что мы вообще понимать то есть cooling твоих действий сначала первое первое это проверить возможно это число уже кратно 5 targa мы его возвращаем как есть вот если оно не кратно 5 это проверим сколько до этого 5 осталось вот и найти большее число которое будет кратно 5 по циклу наверняка ну в общем я наверное сразу пишу первых вот дальше уже каким прибавлять так хорошо сделать цикл вот можно ли как-то попробовать преобразовать как-то число и
00:06:06 - 00:07:45
нам не потребуется делать сам цикл но смотря с остатком отделения давай попробуем это развитие получили остаток деления не знаю что как преобразовать число насадок и delay например макияж что взять до 16 начать вот у него получалось остаток от деления на 52 вот даже если мы прибавим 12 татарским выбираешь но так остаток от деления может нам помочь что искать найти число наверное кратная пяти сейчас секунда на примере 12 дата правильно сказала что остаток при делении будет 2 до 10 них мы ушли на два числа кратны 5 мы
00:07:15 - 00:08:51
шли на 2 больше сторону ну это уже как некоторая информация то есть даже не в меньшем больше получается но все верно у нас есть информация что оно кратно 5 мы можем получить взять вас на такое деление например будет и взять кратное число 5 которые предыдущие до этого числа вот и потом взять следующие за ним через пять давай давайте напишем до алгоритму принципе достаточно правильный получается как но в принципе да один из вариантов еще можно также попробовать целочисленное деление сделать и потом умножить на 5 плюс ну то
00:08:24 - 00:09:56
есть прибавьте единичку и добавить 5 тоже как вариант но в принципе задачкой исправилась все окей давай следующую задачку это уже задачка будет чуть по сложнее тут придется поработать со строчками вот соответственно давай начнем с входных у нас предлагается посчитать количество на грамм ну что такое на грамм анаграмма то есть это два слова которые состоят из одних и тех же букв но в разных расположений то есть low или ул например это на грамм и вот и у нас есть список таких anagram да и нам надо посчитать
00:09:39 - 00:11:02
количество этих на грамм без учета регистра то есть в примере вот у нас видно там большая а большая send большая но это все по сути она грамота состоит из а b и c вот здесь то есть получается три это же самый пример а б тоже примеры то есть вот надо соответственно из данного списка посчитать количество на грамм и попробовать что-то сказали про сложность алгоритма но давайте приступать хорошо мы получаем песок мы можем его сразу образовать не страшно тебе нации букв ниже регистре вот теперь у меня есть идея сделать сортировку
00:10:20 - 00:12:03
каждого элемента вот и записать сколько раз и одинаковые элементы повторять сейчас такой вопрос а ты уверена что соответственно применение лавров даст тебе для всех элементов списка а нет ну а что что что лорд сделает добавить [музыка] но для строке определен принципе давать можно по так вот дальше я думаю что их можно еще с утра вот кстати можно пришивать рука должна работать вот и тогда у нас есть и можно посчитать количество одинаковых элементов нужно простых перебрать например повторы и сексом с решается вот
00:11:28 - 00:13:20
так смотри в принципе логика правильно действительно хорошо что ты используешь словарь хотя почему ты используешь слова интересный момент [музыка] одинаковые но здесь до подразумевается что без импорта типы библиотек смотри есть не большой недочет связанные с методом сорт потому что метод сорт он реализован в списках сошник поправь меня если я не прав вот есть встроенная функция sort it но важный момент вот что sorted он когда соответственно сортирует у нас список из элементов отсортированы то есть он не выдает
00:13:15 - 00:14:44
строку давай попробуем сделать вот соответственно это исправить нет она прям как встроенная функция это не метод это встроенный так а почему нулевой элемент выдает список котором я применяю эту функцию элементы нет смотри то есть у меня есть строка a b c тогда мы к ней применяем sorted функцию то мы получаем список is a b и c элементов три отдельных элементов то есть по сути у тебя строка раздробилась в список ну смотри нет здесь то есть давай нет попробовал смотри если у нас есть строка a b c да видишь мы применяем к ней sorted
00:14:09 - 00:15:55
ну плохой пример давай там боятся интереса то соответственно мы получаем с тобой список вот что я говорю a b c после выполнения этой функции вина вот этот список надо обратно как-то собрать до в строчку a b c такое преобразование сделать работает на самом деле жили правильно поняла действительно сам joy нет короче эти слова будем мы же через него сделать как скорее всего имел ввиду андрей мы же через а да то есть и интересно было действительно помимо суммирования понятно что если мы строчки друг другом просуммируем все будет
00:15:18 - 00:16:54
правильно то есть про встроенными to join просто интересно вот но нет в принципе она заработает все правильно вот сейчас дату всякий вот ну соответственно простейшие скажем так задачки по бетону достаточно хорошо выполнили тогда я предлагаю перейти к задачкам из sql давайте начнем с достаточно простого это простейшего селектор с каунтом вот у нас есть две таблички people то есть да где получается в одной айди человека его имя во второй айди человека его имя прочее иди ой игрушки название игрушки и
00:16:13 - 00:17:44
соответственно айди человека который я приобрел задача нам по сути посчитать ну то есть взять человека и посчитать сколько он приобрел игрушек магазин нам нужно взять человека и пришла игрушек конечно blast игрушки нужно посчитать сколько ну смотри давай еще назовем эту колонку датой аккаунт и давай еще соответственно от ранжируем например возрастающее число и количество и количество игрушек до достаточно но принципе все правильно давай и пару комментариев на что сделала я звонила две таблицы и таблицы people и
00:16:58 - 00:18:40
таблицу то есть ключ у которой она идеи и беру получается имя человека и считаю сколько вы этого человека игрушек каждому человеку чтобы посчитать количество но в принципе правильно давай тогда последнюю задачку пор келли она немножко сложно скажи как у тебя с оконными функциями вообще без них решать хорошо но то есть оконной функции ты как таковые не изучала не знаешь просто задачка она достаточно просто совершается через account найти давай попробуем давай попробуем решить если что мы тебе подскажем
00:19:14 - 00:20:48
смотри у нас есть две некоторые системы дорик рекламный например ну такие как не знаю яндекс метрика и соответственно в две эти рекламные системы падает информация об активности пользователя да то есть соответственно информация есть о айди пользователь есть информация о ссылки на которую он проходит также есть некоторая но нам не особо сейчас интересное действие и есть соответственно время этого соответственно события но дело в том что в то есть если предположим там например в 1930 пользователь сделал там кликнула
00:20:12 - 00:21:31
какой-то баннер то в одну систему это может прийти на при в 1934 в другую там например в 1931 то есть расхождение есть и они разные вот и соответственно в качестве задачки предлагается смочить как раз эти действия между двумя системами соответствовал какая matching она такая что у нас есть айди соответственно нашего пользователя у нас есть ссылка и нам надо из двух этих соответственно таблиц смочить по минимальному расстоянию между таймс темпами таймс темпы они в секунду то есть между ними можно брать разницу без проблем вот
00:20:53 - 00:22:09
давай попробуем соответственно это написать и минимальным времени правильно да ну нам вернее нам надо да и еще постараться отсортировать потому что у нас может быть несколько событий до того же иди того же ю ю л ю л л в таблице нам надо сделать так чтобы смогли то есть мы если как-то jonim получить несколько событий нам надо выбрать самая близкая пара разница между там стеклу ну приблизительно понимаешь давай я походу наверное я верен он нет смотри у нас вот есть пользователь на при этом зашел например
00:21:31 - 00:22:53
там на сайт на google например там на яндекс то есть и там и там в обоих системах это действие отобразится но с разными таймс темпами вот смотри да ты правильно далее информация будет но просто времена будут разные нам на голову то есть может быть несколько записей с но нет то есть повторяющимся иди то есть я могу это например сейчас зайти там в telegram в час дня в два часа в три часа и соответственно все эти три события в системе отобразятся нам надо от их смочить что между собой то есть нас и
00:23:20 - 00:24:39
диски будут и соответственно ярилы одинаковые но танец темпы будут разные нам надо минимизировать эту разницу так смотри вот но теперь осталось по сути написать оконный функцию и принципе и синтаксис ну смотри нам надо взять но согласитесь нам надо взять абсолютную разницу между таймс темпами вот и нам надо как-то соответствует отранжировать то есть во первых нам еще надо тут подумать вот возможно то есть на joy нам дано принципе пока все окей да то есть нам смотри нам надо сделать разницу между toyz темпами и нам
00:23:59 - 00:25:34
надо соответственно присвоить роу ламбер так называемая функция то есть [музыка] мученицы так смотри нам надо соответственно в идеале взять вот вначале то есть эту функцию ламбер между разницей что da da di forte шин бо и нам надо ардов сделать но чтобы нам либо самое максимальное расстояние бы самая минимальная считалось но тоже по разнице представляешь то есть мы взяли разницу между ними матчем по разнице ордер бай да и тут надо понять соответственно возрастающую бываешь намного минимально получается возрастающим
00:24:47 - 00:26:22
целом логика есть какая-то да то есть зло и притом конструкция принципе этом немножко с небольшой помощью было написано так что позже принципе хорошо хряща это приз разбираемся прям на ходу хорошо я думаю что с питоном и спина можно закончить в целом видно что юля подкованная отцом давайте теперь поговорим про имели такую добавить задачу смотри что ты по ней можешь сказать то есть у тебя есть некое пространство признаков и вот как и муж можно ли его разделить а линейной модели такое очень ну это исключили вот так нельзя потому
00:26:00 - 00:27:33
что нужно две линии проводить чтобы исключающие я явитесь обычный линейный песен оао дерева можно например да можно если допустим я провести хорошо а если я все-таки хочу использовать только линейную модель только линейку то что я могу сделать ну получается здесь можно преобразовать признаки попробовать через преобразование признаку какой преобразование крузак чтобы ну вообще в общем случае можно взять все признаки их со второй степени то есть это можно и во вторую извести x 1 x получается не соглашусь если это просто возводишь в
00:26:46 - 00:28:23
квадрат то ты наоборот даты их перебросили в положительную область но ты все равно не сможешь разделить может мы берем вторые степени плюс еще перемножаем x 1 x 2 тыс нас будет переменной x1 квадрате x 2 в квадрате x1 хорошо перемножении мне нравится если ты просто перемножить x1 и x2 то отлично мы я гарантирую что однозначно сможем разделить а нам одного этого признака будет достаточно хорошо давайте перейдем перейдем jupiter ноутбука или тобой задача классификация то есть теперь у тебя есть три признака
00:27:35 - 00:28:54
и есть лейбл давай вот первое что сразу бросается в ноги тебе нужно решить задачу классификации только перейдем как мы начнем смотри вот пинк портировал dct у тебя отобразился вот этот an image да ты знаешь как ето пофиксить да ладно я я сплела себе эту фишку вода а понимаешь почему это происходит и понимали наверно так сохраняем да потому что сохранен с индексами если микс не сохранять при сохранении делать индекс ртс вот так на смотреть да пусть еще раз да супер в общем есть три признака а есть лейбл и я утверждаю что эту задачу
00:28:14 - 00:29:39
можно решить раз со стопроцентной точностью вот а тебе разрешено использовать только линейную регрессию чтобы это сделать и маленькая подсказка эта задача связана с предыдущей можешь пожалуйста построить модель которая выйди тебя лейблы переводимого определять лэйблы классифицировать их со стопроцентной точностью все признаки вообще бросается в глаза чтобы давайте попробуем давая маленькую подсказку давай попробуем в театре есть признака и 1 давай посмотрим а коррелируют ли они как-то старки там вообще как
00:29:01 - 00:30:36
бы ты это как дед на верхний уровень его посмотреть на зависимости признаков между собой я бы наверно грубой хотелось ну давай например давай давай попробуем другим путем пойти чтобы сразу выкрикнув эту задачу мы будем не энергетические лишать а визуально можешь импортировать соборный ремонт плат ведь что ты любишь больше всего давайте на гору построй какой-нибудь pair плод зависимости признаков между свой просто передаем вот смотри что интересно если посмотреть зависимость признака признака 11 признака 2 что ты видишь
00:30:00 - 00:31:32
да это окружность это окружность давайте немножко хитри а пойдем на давай ещё чуть-чуть обогатим этот рисунок мне весь такой параметр давай раскрасим курс таргет лейбл вот теперь уже слать и интересно то есть что ты видишь разделяют окружность да абсолютно верно это просто две окружности сразу бродить по сути чисто герт отдельно этим по признака на себя она пишет дата равно дата фрейм-дата равно в том что он не понимают такое еще но все еще пхи можно раскрасить очень хорошо смотри теперь задача
00:31:05 - 00:32:26
становится намного понятнее то есть ты просто порылась данных построила там плод увидела что на самом деле мы тебя подсунули окружность но тебя только смотри у тебя три признака а ты используешь два давай попробуем как-нибудь 3 смотреть на треть и и понять что он нам даёт вопрос такой нужен ли тебе третий признак для того чтобы разделить эти задачи однозначно но решить эту задачу младших ни одной lancer такие у нас есть давай определимся нужен он нам или нет можем можем общего не использовать хорошо но мы на самом деле с тобой
00:32:14 - 00:33:38
пришли от обратного к этому но если бы ты не знала что эта окружность вот как бы ты вообще отфильтровала бы этот признак давай визуально и вот уже построен что ты видишь при первых то есть вот по бокам какие-то штуки или эти два признака между собой ну то есть не коррелирует нет примерно так выглядит шум ну давай попробуем построить относительно 2 тысячи снова фича 3 отвечая два часа не коррелирует то же самое . давай давай для еще для чистоты эксперимента построен просто инстаграму 3 признака просто кисти сделать
00:33:07 - 00:34:40
только 3 какой то распределением сложно сказать отличной от нормального сказал окей это не нормальное распределение но на что нам более менее похоже посмотри у тебя все столбики все бины у тебя примерно на одном уровне мерно и равномерное да это равномерное распределение как часто ты данных видишь равномерное распределение нормальное распределение своих данных близко к нормальному довольно чаще без нормально это почти никогда не сколько я например как всегда когда вижу равномерное распределение нормально
00:34:18 - 00:35:31
данных я сразу же подозреваю что эти данные синтетические потому что в реальной жизни почти никогда так не бывает если тебе такие данные подсунули то скорее всего ну и нужно очень хорошо подумать долго реально ли они относятся к задач или нет хорошо супер тогда теперь ты знаешь как выглядит твой данные давай построим модель который будет их разделять однозначно посмотри еще раз на зависимость между признаками расскажу можно их линейка разделить не от их только окружность можно также провести да но давай мы попробуем сетки
00:35:11 - 00:36:21
разделить их линейной модели и давай мы дадим тебе понтам 5 минуточек вот ты можешь хорошо как обустроить я думаю что по формуле окружности квадрат и сложить давай пакетик называется watch я такой прием канаты признаки лишь собственно а собственно здесь он отлично себя показывает тест и измене информативного пространство переходишь в больницу нативная а мы какую задачу решаем классификации можем ли мы решить задачу classic отсоединились ну вообще можем но это будет не самар точно провести прямую
00:35:45 - 00:37:26
через две точки мы можем но это не оптимально я просто намекая на то что просто но почему важно залатали гречина выбрать также порог и выше которого 1 класс если туда ракетный удар радость логистическая регрессия отличается от линейной тем что у нас еще есть в конце так у нас получается есть признак который подходит к равнин окружностью собственно вот это мой сказать наш радиус окружности покинул добавить этот признак удар free cool фича хотя скопировать и отец тоже сидят супер на стиснул признак ну давайте
00:36:51 - 00:38:24
построим по этим признакам модель которую наш лейбл кажется ну давай сделаем малый спорт строкам чтобы перевести в руки ничке или я play что хочешь стать и давая для чистоты эксперимента мы все-таки делим на train тест чтобы но не заметить модель вообще под все можно его перемешаем загаданные в начале потому что может быть так что ты на какой-то рассортированы кусок соберешь как бусинка типа отсортировать просто можно было сделать сама начала менять а [музыка] может прокомментировать вот последнюю
00:37:46 - 00:39:20
строчку что ты здесь делаешь индекса одну то есть что выдает но ничего если есть минут predict просто но просто давайте клочок под осложняет начала я 3q посчитаем еще раз какой точность мы прогнозировали одессе давай просто и красиво а давай актер россию в качестве функции напишем [музыка] новую похоже направлен ну вот с отлично выглядящего коэффициенты на какие признаки он смотрит в рамках ну на последние то есть да правильно говорить что он смотрит сильнее всего на генерировали хорошо давай но в этом случае нам повезло но давая
00:38:58 - 00:40:46
чисто для простоты эксперимента мы первые два признаки умножим на миллион и еще раз прогоним твой кот измене субъекты вообще да хорошо такой вопрос про реализацию ты сейчас написала миллиона как не можно сократить эту запись можно сократить как на 10 в какой-то степени в общем ответа что 1-е и 6 можно писать но я думал что просто прыгать в произведении но как бы да и смотри вдруг у нас ведь весь упал в чем проблема на себя перетянули эти ветры сильные слишком большие или сайт или тянули себя вот как на бой спрыгну как можно
00:40:49 - 00:42:28
исправить ситуацию либо еще еще одна такой главный трюк который сразу исправляю ситуацию нормировать как бы нормировать класс да все принимается давайте последний нюанс смотреть на самом деле вот эту задачу с ней справляется даже джон и вот так как у нас уровень middle да давай теперь в сети который импортируется заменим simple на слово комплекс и попробуем решить теперь еще раз я почти не поменялось попробуй понять что теперь так реки штуки супер хорошо а теперь смотритель тебе придется прям подумать какую и какие признаки
00:42:18 - 00:43:52
сгенерировать чтобы снова решите задачу со срочностью сто процентов это уже такой advance кичеджи link не то чтобы он сложно но думать а какие признаки ты бы добавил чтобы разделить однозначно я думаю что также на же отталкивается от уравнение окружности которая была изучаю год ну да зоне но смотрю тебя давно две окружности ноты построена то есть ты построишь дано это будет уравнение окружности для ну как будто бы для одного ну как будто бы для одного прочности для каждой окружность малони и вряд ли она тебе поможет но
00:43:44 - 00:45:16
попробую прогнать модель под различные темень разделение этих двух окружностей и для каждых вполне может бродяга поднимали какой такую точность сама выдаст вот если смотреть на график фича два switch-а один если сделать порог 5 и низшим его взять уравнение одной окружности выше другой я буду я разделила еще воронку да сейчас только давай попробуем сгенерировать google интернете печи и если у тебя получится свои чувства идея зайдёт то на что сюда эту штуку и вот крученый получается если делать как
00:44:45 - 00:46:33
прошла у вас давайте уберем вот это умножение на миллион может быть за комменте тогда закомитить сюда случайно не умножить хорошо ну давай просто тогда не будем реализовать код просто послушаем видите если вот и сказал можно какую-то линию провести но представь что ты лишь пытаюсь что-то линейной регрессии это просто дал ещё один признак я говорю тебе относительно с какой стороной посетитель на линии 3g штамп плюс-минус до 7 лет у тебя поможет ну я просто планировать меньше чем порог например 5 тысячи и и
00:45:52 - 00:47:18
меньше чем блог по опять получается тут 5 5 вот и разделить вот на кружимся в тех пор она похожа на ту которая была задача про умножение то есть так как здесь 2 порога тоже хороший хорошая идея можно перенести их в одну плоскость да я не наложниц и дальше пить первый метод работы да хорошая хорошая мысль а как бы ты это сделала как просто здесь не получится тут нужно но если бы у тебя не та линия как пересекает центр этих двух окружности он бы лежал бы на центр этой прямой лежал бы в нуле то тогда ты могла бы умножить
00:46:43 - 00:48:13
и у тебя действительно из-за того что разные знаки не у тебя этом совпали вот но так как у тебя здесь они у тебя в положительной плоскости то просто при умножении и получится перед простым перемножением запросто их с мистическим повыше вот поэтому [музыка] квадраты ну смотри то есть у нас же задачку который мы решали чуточку раньше до теоретического там же все получалось когда у нас но страшно же говорит было соответственно ситуация что что-то в положительный что-то отрицательно сейчас же у нас видно что среднее ну
00:47:46 - 00:49:10
скажем так линия разделение лежит где-то в районе 5 то есть надо сделать первый шаг приведения по сути надо просто вычесть из всех признанного да да и хорошие короче не просто нормировать даны можно действительно взять standards келин и ты по сути свистишь свои данные в центр в этом случае это сработает ли этот подогнал данный что-нибудь и симметричные красивые одинакового радиуса здесь работает вот но допустим они у тебя еще разного радиуса вот тут уже надо подумать посидеть вот давай опустим эту задачу где имея понравилась
00:48:30 - 00:49:50
понравилась твоя мысль с этим как можно разделить вот моя версия была не что ж не мешает тебе найти центр для каждой окружности и просто посчитать расстояние вот этого центра до точки тогда ты смогла бы разделить campo радиуса тоже тоже способ вот но кажется что он стандарт келин он более изящный хорошо давай закончим с этой задачей поговорим теперь о культуре а вот смотри ты знаешь задачи классификации да я уверен что ты и решала своей жизни даже мы задачу мульти классификации вот но приходилось ли тебе когда-нибудь мне
00:49:10 - 00:50:43
делать с мульти лейбл . ции что это значит но получается что у нас есть не 2 класса больше в один момент может быть сразу несколько классов смотри вот допустим здесь будет тебя было был лейбл его был бы столбец лейбл еще 2 тоже столбец лейбл который тоже был бы задачку искать могла бы ты вещица задачу какое-нибудь обычное линейной регрессии логистической регрессии вообще в теории классификация макс [музыка] функцию ну а как бы три собств макс поместила бы его ну то есть это тебе пришлось бы логистической лесенкам самой написать а
00:49:56 - 00:51:45
как например используя вот blackbox исаки clear на решите задачу на то есть не дописываю этом свои солнце но я знаю еще метод который предсказывать как будто это два класса то есть один на первом за единицу от рукой все нули и рассказывать каждый раз вот так каждый класс да супер есть такой способ а какая у него проблемам может быть но то что мы не различаем другие классы они могут быть не похоже тоже может быть проблема в том что до там не один класс так и не предскажет если ты ставишь все классы 0
00:50:57 - 00:52:19
и интересующиеся класс как единичка то может быть такая ситуация что ты ни разу единичку не предскажешь класса получается просто попробовать решить этот дисбаланс как сады астана нужно решить дисбаланс классу которого молода через а побольше вот либо можно еще есть техника вроде смот называется которая генерирует похоже на плетение на которой уже есть вот недостающего класса ну еще можно решаешь какой-то части выборки выгрузить данные того класса которого но смотри это так называемо down сэмплинг такому урезаем еще есть
00:51:41 - 00:53:18
минорный класс не ремонт получается новый например ну то есть дни рим новые соответственно признаки вот но смотри смотрят как-то более сложно да то есть а вот самый простой как можно вот у нас есть выборка маленькая и как из неё можно получить большую у нас например там минорного класс например 100 тыс счет нам надо сделать хотя бы ну в общем расскажу вот как бы ты делала с помощь про абсент блендер распределение смотреть фича и еда генерировать фичи из этого распределения которые есть я я засчитываю знаешь ли ты
00:52:40 - 00:54:01
что такое я компромисс между весом и варятся улыбаясь раз получается у нас вообще когда мы чтобы предсказываем есть ошибка модели она разлагается на 3 компоненты это вот боюсь это смещение аварийность дисперсия и шум с шумом мы ничего не можем сделать вот боятся верен своим их можем балансировать зависимости от того вообще выходить локтю между ними вот борис это когда у нас смещение собственно нашей ошибки идет в какую-то сторону систематическая а вариант это разброс вокруг среднего вот и собственно чем проще у нас модель
00:53:26 - 00:54:49
тем сильнее назвали и чем сложнее модель тем выше а если я самого начала делаю не совсем верное предположение данных не делаю там какое-то упрощение в понимании эта модель это какую ошибку я увеличиваю барин сирии боясь то есть супер хорошо а тогда что такое компромисс между этими компонентами почему мы его ищем ну вот как я уже сказала мы можем регулировать сложность модели вот чтобы у нас не было слишком сильного смещения и слишком сильно выраженный spersy вор потому что если оно сильное смещение от это не до
00:54:12 - 00:55:38
обучения на селе дисперсия таперича и почему мы не можем взять просто на сложную модель на будет выставка дисперсия очень хорошо все тогда последняя секция дим смотри и ты можешь просто пожарить людьми свое странный they с и мы его допустим разберем супер мне первый нюанс на что сразу стоит обратить внимание у тебя я же правильно понимаю что ты вообще ищешь позицию десанте или айос разработка а как это понять вот исходя вот допустим есть измен чтобы поесть и мне нужно почитать какой у тебя стек да вот
00:54:57 - 00:56:25
почитать твой work experience посмотреть какие у тебя были как называлась от кого позиция на работе тогда понимаешь что ты да и писать вот но хорошая практика это в самом начале указывать позицию на которую ты поддаешься то есть юлия фокина и дальше позиций касается это мужик инженер или там front and pulls так вот первое прошел второе это у тебя у тебя и стенки день его допустим указывать или то и другое я вас на несколько то есть один и уже потом скидываются это лишнее просто отсылочки который представлен раз на
00:55:44 - 00:57:11
него вставлен и то больше ничего ну покажи ссылочку мышкой ну вот все синее это ссылки на тихо на те проекты как еще хотела показать окей но не совсем очевидно не самая очевидная науки если мне было бы очень интересно резюме скорее всего бы я об этом разобрался и понял бы что ссылки на вот но если я еще и этом хочу я знаю did have только по слову did have я не буду это может быть чисто что я был бы плохим вечерам начал это на самом деле разбирайся резюме круто я так понимаю что она подготовлена по три но стороны
00:56:34 - 00:58:09
скажу так компании конкретно под юбки ну вот фотки не это на принципе понятно что уже как бы женский пол даю ли я как-никак вот но действительно замечание согласен полностью я бы клипа ну сюда вставку гид hop and in кстати тоже можно кстати классная практика действительно какой-нибудь мессенджера telegram спасли время сейчас все используют вопрос для быстрого контакта потому что примерно телефон с этом 8 и с восьмёрки начинается да это российский как бы не всей чары будут звонить туда там или еще что то есть лучше телеграммы указать
00:57:21 - 00:58:46
я советовалась теми кто в лондоне и ребята говорят что филе грантом не используют особые поэтому я выбрала а номер как только появится сразу же поменяюсь российского четверки не заграница полезно показывает сколько у тебя годах туз патчи иных годах то есть конечно можно просмотреть примерно твоего хронологию работы вот а лучше если без рад напишешь пять лет whisperingly я сразу vol 5 лет кладем стопочку для тех кого будем распад а другую стопочку кладем тех кого нужно посчитать и когда они потом посчитаем
00:58:03 - 00:59:24
сколько у меня горкой референса тоже полезно указать но по work experience я продолжу вроде в принцип вопрос никаких нет единства смущает скажем так вот одинокий инглиш лайович а можно дальше пролистать чуть решает направиться то есть это финальная финальные титры вот это ну не знаем лишь немножко комично потому что как-то вот ну то есть в конце честно тут сложный вопрос на просто как told он так по сути одно из самых важнейших скажем так в требований для работы в англоязычной компании это знание английского на какому-либо уровня
00:58:46 - 01:00:16
она как-то совсем так забитому голу вот но может есть смысл его поднять отдельно там но блин ваще не знаю в общем как-то но вы на самом деле я не могу все всходы так придумать да то есть назвали единственное что я нисколько вот например проекции на лондон это котируется угодно еще часто указывают курсы какие-то известны в одно из кресел ты их осознанно не указала потому что видимо не там там уж не смотрит у них вот но можно разнообразить немножко добавился какие-то курсе сертификаты по направлению
00:59:33 - 01:01:07
что то еще но сертификатов отлично to make the cursor у например dlink не добавляется без проблем поэтому если ну какие-то сертификаты которые могут можно блинкин добавить toeic я бы мы смысла нет то есть это курс rdx и так далее так далее да то есть когда я еще я знаю что ты решаешь вид код или ranking давайте какая-то статистика нам уже набрана я видел указывают в режиме свой профиль если у тебя там допустим нарежь и на 200 псам двести-триста задач то это очень подкупает остановил решаешь каждым резюме тот
01:00:22 - 01:01:42
момент важен и тоже вот я в конце заметил то что помимо основного за там product analyst да это сами тесты все остальное я увидел что ты методу methodologies методы металл методолог оттуда резать не надо ни на мемы разойдется вышки смотреть здесь бы я бы это выделил как не только work experience ночью как птичий experience потому что действительно это любят как скажем так некоторые волонтерской работой в икею часто любят на самом деле я тоже и птичьим экспириэнс до что действительно ты и трампу преподавала
01:01:04 - 01:02:38
дождь из того что видно здесь как бы вот действительно притом ты как бы вот действительно там не подготавливала тесты и так далее при экзамена на этом отдельно облизывает очень ты можешь прямо в отдельную секцию написать тычинка гигант я например в измене отдельную отдельную секцию там быть и я указываю какие там конвенции школу как френд зону прекрасного минут простенькой за курсом есть есть нюансы которым можно добавить ну вообще выглядит приемлемо может не вижу тебя нет вот что ты это умеешь дизайне тесты что
01:01:56 - 01:03:31
ты умеешь мутировать моделька в продакшен последний пункт примерно об этом вот на этой плате здесь они знают об этой стинг да вот возможно это будет полезнее напихать какими-то японский ключевые слова которые вот у чаров сидят в голове я не только на не смотрят по 200 как популярная шутка знаешь что человек пишет у себя близнец что он знает view on гулар react а ему ridgid как говорить черт нам нужен человек который знает java-script вот смешно но обильно просто тепла казалось бы это одно и то же на более такими
01:02:51 - 01:04:23
громкими словами но человек могут так простенькая и понятно резюме я не было бы понятно что ты чем-то занимаешься да в принципе все хорошо все хорошо июля есть либо какая-то обратная связь поделиться в принципе мы закончили мы что-то сказать поделиться в процессе разбора резюме вот и я подумала что было бы прикольно если бы мы показывали то же самое рассказывали давай вообще кстати именно так мы сделали на первом видео раз мы пока не закончили давай откроем откроем моим вот это мой не самый идеальный пример ну
01:03:39 - 01:05:06
смотри я например пишу что я делаю и я например в один момент перестал писать gotta say in this потому что я заменил надо то аналитик потому что я заметил что как раз вот другие люди писали дата аналитик вот на час я на уже вообще снова переобулся мне кажется лучше писать все таки с молодой красавец у меня разбиться все на секции то есть отдельно колоночка work experience у меня есть отдельно experience вот есть отдельные языки то есть языке я прям подчеркивая секцией о том что я вот там за английский на b2 и
01:04:27 - 01:05:55
отдельная еще очень люблю когда сами скиллы разбиты на секции я давно не обновлял и и вот сейчас бы немножко по-другому сфальсифицировал вот месте управ аринка деле' например пишу вещи которые относятся к морю вещь которой относится к тёплую вещь которой относится к deeply рынку вот и тогда я прям тегами подсвечиваю что было ты что вот я соответствует тому списку который скорее всего вы чекаете когда просматривать резюме вот еще я проверял что они хорошо парси цвета фуксия чуть бокс бокс и они хорошо
01:05:14 - 01:06:36
партиции своих автоматически не хватает описание work experience вообще что далее кстати слышал я слышал такой а я слышал такой комментарий что не хватает описание что то делать то есть попутно есть такое даст очень хорошее замечание я кот работами все это никак не напишу но какие-то тесты то есть у меня есть он на самом деле присмотришься есть по одному и фразе какой дороге in production да все равно не понятно и не об этом говорили на надо подлечить но так как я активно ничью я показали вот у меня есть еще вторая
01:05:54 - 01:07:12
страничка где я пишу про проекты который не занимался плюс какие-то дополнительные вещи типа чапман соли какой-то research экспирианс здесь можно сослаться на статью которая у тебя и есть если ты занимался наукой до этого тоже можно это указать и конференции хобби вот а вот кстати у тебя нет хобби но это бессмысленная штука но если ее добавлять то полезно добавить какое-то хобби который тебя в хорошем свете показываю да там не слишком анализа данных не участвующих чемпионатах по на результат прикольно . беренс я писал
01:06:36 - 01:07:53
какие проекты что я делал и то же ук указал ключевые слова вот тоже не очень подробно с в описании 0 можно например тут по покликать на меня и посмотри что дело тут набрать ссылочка на втором но тоже минут фиксить хорошее замечание да не самый идеализме вот всегда есть чему придраться покинь так ну хорошо тогда на этом наверное все хорошо сидит сказал про людьми мучить разобрались трое цвет моего первого видео тоже разбирали вот и получается что мы одно и то же резюме некачественного на первом и втором но
01:07:15 - 01:08:43
зато вода тоже живая встреча до нас еще раз будем смотреть на идеальную резюме андрея уверен насчет фидбэка собственно с питоном видно что ты ориентируешься хорошо с успехом тоже отлично но вот если вы сквер чуть-чуть капнуть до перейти к оконным функциям то тут нужно немножко попрактиковаться но законы и функции то часто пунктик исследования специальными функциями не владею что это как будто бы понижает выводить да на сам проект на практике оконной функции не так часто нужны но это хороший признак
01:08:09 - 01:09:21
того что ты разбираешься в сквере потерь по e-mail держалась очень хорошо то есть на теоретические вопросы 100 граммов отлично отвечала в плане кодинга тоже мне показалось что очень хорошо то есть такая задача должна была по идее вначале ошарашить до ноты в принципе мало мало и он разрешил а вот и в принципе фичей но это вообще задача была на фичеринг те признаки которые ты назвала они ногти по хорошо разделили видно было что есть медали просто побольше времени ты сама будешь алла эту задачу дует и
01:08:52 - 01:10:03
спокойно бы ее разрешила и ты понятно ты не теряешься когда видишь какие то какие то файлы с которыми встречаюсь например когда у тебя модель перестала в казань точность а у тебя были идеи что делать на практике значит всего находишь легко находить решения как стенс является газету ты сказал нужно постелить потому что у тебя линейка она к масштаб признаков с числитель тоже prophet б куда то есть в принципе действительно по e-mail часть теоретической все знания с келли саша уже сказал да то есть база во что
01:09:27 - 01:10:52
необходимо также позицию мидла в принципе справляешься на действительно просто как бы в большинстве случаев там иногда вот например на моем примере она используется оконные функции задачка была схожая с кем ты сказать что у меня используется в работе вот то есть оконные функции используются редко но почему-то на собеседованиях испрашивают практически повсеместно считается как говорил как сказать валера бабушкин незнание функции ты это сильными минус а знание функции это не плюс вот собственно такая тема до единственно
01:10:10 - 01:11:25
верное еще хотелось бы поработать над соответственно и я изящностью немножко кода да ну с точки зрения есть больше проработать именно харти килы там различные штучки то есть хотелось бы сразу видеть функции да ну то есть прям сразу очень круто если ты вот там что-нибудь решила еще там нет classic влепила прям сразу так быстренько вот этому просто показал от частоты там группы как бы вопрос никаких нет да то есть но в принципе еще можно было наверно когда-то маг использовался для буклета функций
01:10:48 - 01:12:07
указать ну то есть просто нет в принципе я думаю ты все знаешь просто можно было одно сделать так другая так и тем самым показать больше что ты ему экспертность больше имеешь вот шире в общем чем у тебя требует вот а так в целом мы действительно ты меня мне показалось мне показалось что это было бы наброситесь мы же ней с самого начала мы не задали типа критерии как эту задачу мешать поэтому то что ты и в принципе решила да и не важно каким образом этот день там были какие-то мелкие нюансы потому что
01:11:27 - 01:12:37
там в двух местах писала но нарушала драй принцип 500 до можем был вначале написать но это типа ну не критерии для наша задача был понижен до предложены критерии да то есть в нашем случае как бы это не минус ничего просто вот действительно очень этот формат пока обсуждали вспомнил про мульти лейбл задача там на самом деле мы с тобой стены перестали эту тему сильно глубоко копать вот мы там можно было на самом деле сестра способы как линейку например превратить multi-level задачу более изящно там есть
01:12:02 - 01:13:28
некоторые проблемы которые приводит к тому что ты класса какие то не сможешь вообще предсказать вот есть обходы и вот и потому что не надо было взять но это такая редкая задача мульти лэйблом редко встречается вот как на самом деле в плане бизнеса а ты по сути предсказывающие может ли человеку порекомендовать сразу два продукта это более на самом деле более про такая умная задача потому чаще всего когда мы говорим что человек может выбрать scooby только один продукт пытаемся посоветовать только один а
01:12:46 - 01:13:50
ничто не мешает вам посоветовать ему два и задачи классификации на этот случай это мультипликации это некая попроси мация это некое такое упрощение ему телеку это более реальная задача и нужно ее увидеть решать ты хорошо сказал про вас of max то можно было еще порыть мишка в декретный сообщает задача мульти локация научи решается diprolene чем какой-то классической модели вот хорошо да то есть я бы тебе поставил придумать какую-то абстрактную вести балльную систему я бы поставил тебя 89 а вот исполняем лично хорошо
01:13:17 - 01:14:48
теперь можно сразу же по моему мама банщик
01:14:02 - 01:14:10