DiXi Group — аналітичний центр, що займається дослідженнями та консультаціями з питань інформаційної політики, енергетики, безпеки та інвестицій. Вакансія передбачає роботу у межах проєкту USAID «Прозорість енергетичного сектору».
Обов'язки
автоматизований збір (завантаження) даних з вебсайтів (веб-скреппінг) та ручний або напівавтоматизований з неструктурованих ресурсів (наприклад, розпізнавання інформації з фото-, сканкопій, документів pdf)
реструктуризація масивів даних у прийнятний для аналізу вигляд (машиночитний формат)
підготовка агрегованих масивів даних
перетворення неструктурованих табличних даних у машиночитний формат
перевірка наборів даних на предмет допущених технічних помилок, наприклад, пропущені розділові знаки, дефекти при оцифруванні даних
очищення даних за допомогою регулярних виразів
проведення кількісного аналізу даних на предмет закономірностей, виявлення зв‘язків, кореляцій, факторів впливу
створення звітів на основі даних
автоматизація формування звітів та/або статистики
Вимоги
досвід роботи у R та/або Python
досвід створення інформаційних/аналітичних продуктів на основі даних