Частотный словарь

Задача: Получив на входе корпус языка (огромный набор атрибутированных текстов на каком-нибудь языке) построить частотный словарь. Знаки препинания, скобки, кавычки и числа должны быть удалены. Слова, содержащие в себе не буквенные символы, игнорируются целиком.

Реализация: Код на ideone

2 thoughts on “Частотный словарь

  1. Сам код — правильное решение первой подзадачи. По коду претензий нет, все верно.

    К сожалению, нет тестового ввода и вывода (можно для очень маленького файла) и пояснения — какие структуры данных используются. В частности, как упорядочены слова в Вашем словаре (если упорядочены вообще)?

    Конечно Вы хорошо назвали свои методы, но все же для стороннего наблюдателя toAlpha могло бы быть не понятно что делает — нужно пояснение, в виде комментариев (еще лучше Javadoc) или краткое пояснение в отчете.

    • Пока что, 12 баллов (код есть, пояснений, примеров входа, выхода нет).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *