Логическая семантика, извлечение и суммирование информации
Я хочу узнать общее представление об этих вопросах, в области анализа данных и НЛП. Какие шаги включены? Если я хочу извлечь значимую информацию из любого предметного текста и понять общую идею любого текста.
Другой вопрос: чем больше размер анализируемого текста, тем лучше результат?
Извините за мое невежество. Я хочу понять больше, и мне бы очень помогло, если бы вы предложили какие-нибудь учебники или чтения.
1 ответ
Я предлагаю "Обработка речи и языка" Дэниела Юрафски и Джеймса Х. Мартина. Последние главы посвящены извлечению и суммированию информации.
Что касается вашего вопроса о размере текста, это зависит. Исходя из моего опыта, извлечение информации лучше работает с короткими предложениями. Однако вам потребуется большой набор данных для обучения вашей системы распознаванию соответствующих шаблонов.