23 август, 2019

Поредният Datathon се организира в столицата. Серги Сергев е един от съоснователите на доброволческата организация Data Science Society, които стоят зад това събитие. Серги се занимава с подобни инициативи и събития повече от 8 години. Ангел Марчев е преподавател по моделиране и ентусиаст в организацията, който помага активно.

Финалът на Datathon 2019 ще проведе на 16 април в SofiaLab, където г-жа Фандъкова ще награди победителите.

Какво е Datathon? Какви са основните теми в него?

Серги: Datathon-ът е нещо, което се зароди преди няколко години. Идеята беше да се даде практическа възможност на младите хора и хората, които искат да навлязат повече в data science. Все пак работим, за да решават проблеми на обществото или на компании. Аз и преди съм участвал в дейтатони, сега мисля да участвам в този. За 2-3 дни всеки един млад ентусиаст може да натрупа знания, които ще му отнемат месеци да намери сумирани. Това ще бъде 8-ми Datathon. По принцип тези събития са отворени за всички.

Ангел: Голяма част от дейтатона е онлайн. Участват хора от различни държави – САЩ, Индия, Малайзия и др. Разработили сме за тази цел наша платформа. Ако говорим за конкретния дейтатон, имаме два казуса – едната тема е предоставена от Kaufland, по която трябва да се работи по базата данни със стоки и дали те са подредени правилно, а другият казус е за замърсяването на въздуха в София. Във връзка с казуса за въздуха имахме друго събитие, на което прогнозирахме замърсяването по локации с един ден напред, което е почти най-доброто, което може да се направи. Имаме общия фон на замърсяване за общия фон на София.

Какви компании ви подкрепят? Какви организации се включват?

Серги: В момента работим с компании, които виждат смисъл какво е общност и как тя се изгражда. Вярват, че знанието трябва да е споделено. Кодът трябва да е споделен. Едната компания, която ни подкрепя е Telelink. Работим също така с Kaufland, със Столична община, с Асоциация за развитие на София, с Amazon Web Services.

Ангел: Бизнес секторът се интересува най-много от сферата с бази данни. Винаги сме намирали приятели и съмишленици, които са по-скоро с каузи. Не една кауза сме решавали дали ще е рамките на проект, дейтатон или месечно предизвикателство.

Какви резултати очаквате от този Datathon?

Ангел: От двата казуса ще има модели. Моделите ще са еди-си-колко работещи и това е ясно. Но по-абстрактно, ако погледнем, два проблема се очаква да бъдат решени. Всички наши участници предоставят целия си интелектуален труд под формата доклад. Имаме достъп и до целия им програмен код. Казусите ги оставяме онлайн и след две седмици или два месеца, някой ако реши да ги решава отново. Резултати ще има в много посоки.

Какви технологии ще се използват?

Ангел: Първо ще се използва cloud computing през AWS. Това е задължителна технология. След това ще се използва notebook тип работа. Това е документ, който по принцип е писмен, съдържа и програмен код и може да се въвеждат освен това и резултати. Това стандарт в Data Science сферата. Използваме GitHub да синхронизация на версии. А от cloud vision за изображенията ще преминем на революционните невронни мрежи. Защото сега deep learning е много популярен. Друго не мога да кажа още. Ще видим какво ще измислят участниците.

Серги: Програмните езици са Python и Arc. Някои използват за ядрата код на C и C#. При нас е важен резултатът. Трябва да използват някакъв скриптов език, който да имплементира тяхната логика. И дали ще е Arc, Python или Java, по-скоро е важно каква е задачата и как се решава.

Тагове: , , , , , , ,