Speech and Language Processing
by Daniel Jurafsky & James H. Martin & PetrSU students
Обработка текста / Basic Text Processing | |||||
№ слай-дов | Тема | Topic | ФИО | Дата | Презен- |
1-12 | Регулярные выражения / Regular Expressions | Крижановский Андрей Анатольевич | ? | todo | |
13-28 | Разбиение на токены / Word tokenization | Буллиева Дарья Михайловна | 2017 | ||
29-39 | Нормализация, лемматизация и стемминг / Word Normalization and Stemming | Ерофеев | 2017 | ||
40-46 | Разбиение на предложения и деревья решений / Sentence Segmentation and Decision Trees | Анисимова Мария Сергеевна | 2 октября 2017 | ||
Минимальное расстояние редактирования / Minimum Edit Distance | |||||
1-11 | Определение минимального расстояния редактирования / Definition of Minimum Edit Distance | Голубев Андрей Алексеевич | 2017 | ||
12-19 | Вычисление минимального расстояния редактирования / Computing Minimum Edit Distance | Хорольский Егор Николаевич | 2017 | ||
20-28 | Обратный ход для вычисления выравнивания / Backtrace for Computing Alignments | Новиков Павел Иванович | 9 октября 2017 | ||
29-35 | Взвешенное минимальное расстояние редактирования / Weighted Minimum Edit Distance. | Ваганов Андрей Вячеславович и Липинский Владимир Олегович | 2017 |
Моделирование языка с помощью N-грамм / Language Modeling with N-Grams | |||||
№ слай-дов | Тема | Topic | ФИО | Дата | Презен- |
1-13 | Введение в N-граммы / Introduction to N-grams | Вершинин Илья Валерьевич | 16 октября 2017 | ||
14-27 | Оценка вероятностей N-грамм / Estimating N-gram Probabilities | Арина Юрьевна Демидова | 23 октября 2017 | ||
28-37 | Оценка и перплексия (мера удивления) / Evaluation and Perplexity | Рего Григорий Эйнович | 30 октября 2017 | ||
38-47 | Обобщение и нули / Generalization and zeros | Ведешкин Сергей Алексеевич | 13 ноября 2017 | ||
48-57 | Сглаживание: добавление единицы по Лапласу / Smoothing: Add-one (Laplace) smoothing | Малафеев Степан Алексеевич и Степанов Михаил Яковлевич | 2017 | ||
58-67 | Интерполяция, откладывание (задержка) и веб-масштабирование языковых моделей / Interpolation, Backoff, and Web-Scale LMs | Лайтинен Никита Владимирович | 20 ноября 2017 | ||
68-76 | Сглаживание Kneser-Ney / Advanced: Kneser-Ney Smoothing | Фокин Василий Дмитриевич | 27 ноября 2017 |
Проверка правописания и зашумлённый канал / Spelling Correction and the Noisy Channel
№ слай-дов | Тема | Topic | ФИО | Дата | Презен- |
1-8 | Задача проверки правописания / The Spelling Correction Task | Ключников Максим Сергеевич | 4 декабря 2017 | ||
9-31 | Модель зашумлённого канала правописания / The Noisy Channel Model of Spelling | Корнышева Мария Александровна | 11 декабря 2017 | ||
32-42 | Практическая проверка правописания / Real-Word Spelling Correction | Дятлова Александра Михайловна | 18 декабря 2017 | ||
43-51 | Современные системы / State-of-the-art Systems | Епарская Анна Сергеевна | 25 декабря 2017 |
Доклады для отсутствовавших на занятии студентов брать по теме “Лауреаты премии Тьюринга”.
Кого выбирать:
Герберт Саймон - 1 человек
Юрис Хартманис
Ричард Э. Стернс - про этих двоих лучше выбирать сразу двум студентам и рассказывать чохом
Майкл Стоунбрейкер - 1 человек
Литература
Подготовка доклада
Текст книги “Speech and Language Processing by Daniel Jurafsky & James H. Martin” и слайды на странице https://web.stanford.edu/~jurafsky/slp3/
Задание:
*) Если вы хотите рассказать о какой-либо компьютерной программе или о каком-либо алгоритме, методе, технологии, связанными с обработкой текста и вычислительной лингвистикой (вместо тем докладов, перечисленных выше), то обсудите вопрос с преподавателем.
Ссылка на эту страницу на Google Docs: goo.gl/QpsdmI
Ссылка на эту страницу на сайте Крижановского А. А. http://whinger.krc.karelia.ru/paper/cl/SlidesSpeechandLanguageProcessing.html