Использование Google Natural Language API для очистки "темных" данных в Google Sheets
Давным-давно я создал форму Google, чтобы позволить руководителю ежедневно вводить заметки о ходе выполнения работы.
Форма была, к сожалению, немного расплывчатой, и у меня есть только поля для:
- Дата
- Количество техников
- Всего человеко-часов за день
- Всего неоплачиваемых человеко-часов (перерывы на обед и т. Д.)
- Заметки
В текстовом поле "Примечания" у меня есть неформальное обозначение часов, в течение которых работал человек, и примечания о том, над чем работала команда.
Пример 1:
"Conduit Delivery-Short" только 1 из 12 комплектов доставлено
Сердитый:
10:00 - 14:00
Backbox Layout 1-й этаж семейный номер
Установите 2 пары задних ящиков
Временное размещение для рассмотрения генералом и разработчиками
Пройдите через кабелепровод в дверных окопах с DopeyДопинг: с 10:30 до 14:00
Ученическая работа
Сценический канал доставки материалов
Прочитайте информацию по технике безопасности на сайте команды - Майк Габриэль и Джош
Вырезать в задних коробках с Grumpy"
Пример 2:
"Застенчивый - 8
Чиханье - 8
Сонный - 8
Док - 8
Допей - 8Ежедневно
• Кухня проволока тянуть
• Проводное управление на протяжении всего проекта
• Проводные терминалы в спальне, северной и южной прихожей, гараже, террасе
• Готовая 3x 2”подача на осветительные панели 6,7 и 8
• Добавлены резервные батареи на 3 камеры безопасности.
• Террасные светильники в комплекте с док "
Обратите внимание, что есть два разных способа обозначения часов. И иногда они пишут AM, иногда пишут PM, иногда они вообще не записывают время.
Вот что я пытаюсь сделать с помощью этого набора данных:
- Google NLP распознает имена и связанные часы, сгруппированные вместе. Он игнорирует имена, указанные в самих примечаниях.
- Вставьте их в новые ячейки для начального и конечного часов в новой строке для этого специалиста на эту дату.
- Очистите извлеченные данные от ячейки.
Я очень удобен, и я думал об использовании Regex, но я осторожен со старой фразой...
Некоторые люди, столкнувшись с проблемой, думают: "Я знаю, я буду использовать регулярные выражения". Теперь у них есть две проблемы.
Я сумасшедший, чтобы думать, что НЛП может помочь с этим?