Speech and Language Processing

by Daniel Jurafsky & James H. Martin & PetrSU students

Chapter 2. Regular Expressions, Text Normalization, and Edit Distance

Обработка текста / Basic Text Processing

2_TextProc.pptx

слай-дов

Тема

Topic

ФИО

Дата

Презен-
тация

1-12

Регулярные выражения /

Regular Expressions

Крижановский

Андрей Анатольевич

?

todo

13-28

Разбиение на токены /

Word tokenization

Буллиева Дарья Михайловна

2017

ppt, pdf

29-39

Нормализация, лемматизация и стемминг /

Word Normalization and Stemming

Ерофеев
Илья Сергеевич

2017

pptx, pdf

40-46

Разбиение на предложения и деревья решений / Sentence Segmentation and Decision Trees

Анисимова Мария Сергеевна

2 октября 2017

pptx, pdf

Минимальное расстояние редактирования / Minimum Edit Distance

2_EditDistance.pptx

1-11

Определение минимального расстояния редактирования /

Definition of Minimum Edit Distance

Голубев Андрей Алексеевич

2017

pptx, pdf

12-19

Вычисление минимального расстояния редактирования / Computing Minimum Edit Distance

Хорольский Егор Николаевич

2017

pptx, pdf

20-28

Обратный ход для вычисления выравнивания / Backtrace for Computing Alignments

Новиков Павел Иванович

9 октября 2017

29-35

Взвешенное минимальное расстояние редактирования / Weighted Minimum Edit Distance.

Ваганов Андрей Вячеславович и Липинский Владимир Олегович

2017

pptx, pdf

Chapter 4. Language Modeling with N-Grams

Моделирование языка с помощью N-грамм /  Language Modeling with N-Grams

LM_4.pptx

слай-дов

Тема

Topic

ФИО

Дата

Презен-
тация

1-13

Введение в N-граммы /

Introduction to N-grams

Вершинин Илья Валерьевич

16 октября 2017

14-27

Оценка вероятностей N-грамм / Estimating N-gram Probabilities

Арина Юрьевна Демидова

23 октября 2017

28-37

Оценка и перплексия (мера удивления) / Evaluation and Perplexity

Рего Григорий Эйнович

30 октября 2017

38-47

Обобщение и нули / Generalization and zeros

Ведешкин Сергей Алексеевич

13 ноября 2017

48-57

Сглаживание: добавление единицы по Лапласу /

Smoothing: Add-one (Laplace) smoothing

Малафеев Степан Алексеевич и Степанов Михаил Яковлевич

2017

pptx, pdf

58-67

Интерполяция, откладывание (задержка) и веб-масштабирование языковых моделей / Interpolation, Backoff, and Web-Scale LMs

Лайтинен Никита Владимирович

20 ноября 2017

68-76

Сглаживание Kneser-Ney /

Advanced: Kneser-Ney Smoothing

Фокин Василий Дмитриевич

27 ноября 2017

Chapter 5. Spelling Correction and the Noisy Channel

Проверка правописания и зашумлённый канал / Spelling Correction and the Noisy Channel

6_Spell.pptx

слай-дов

Тема

Topic

ФИО

Дата

Презен-
тация

1-8

Задача проверки правописания /

The Spelling Correction Task

Ключников Максим Сергеевич

4 декабря 2017

9-31

Модель зашумлённого канала правописания /

The Noisy Channel Model of Spelling

Корнышева Мария Александровна

11 декабря  2017

32-42

Практическая проверка правописания / Real-Word Spelling Correction

Дятлова Александра Михайловна

18 декабря 2017

43-51

Современные системы /

State-of-the-art Systems

Епарская Анна Сергеевна

25 декабря 2017

Лауреаты премии Тьюринга

Доклады для отсутствовавших на занятии студентов брать по теме “Лауреаты премии Тьюринга”.

Кого выбирать:

Герберт Саймон - 1 человек

Юрис Хартманис    

Ричард Э. Стернс - про этих двоих лучше выбирать сразу двум студентам и рассказывать чохом

Майкл Стоунбрейкер - 1 человек

Литература

Подготовка доклада

Текст книги “Speech and Language Processing by Daniel Jurafsky & James H. Martin” и слайды на странице https://web.stanford.edu/~jurafsky/slp3/ 

Задание:

  1. Прочитать свой раздел в книге D. Jurafsky, J.H. Martin.
  2. Взять указанные слайды с сайта книги. Вырезать для отдельной презентации.
  3. На первом слайде указать (1) название темы, (2) откуда взят материал, (3) ФИО студента, (4) дату выступления.
  4. На первом слайде в пункте (2) укажите номер главы и номера страниц в PDF-файле книги D. Jurafsky, J.H. Martin, где дано описание вашей темы.
  5. На каждом слайде (или между слайдами, если вопросы объёмные) добавить по одному вопросу к слушателям (по теме работы, для проверки и усвоения материала).
  6. Добавить нумерацию слайдам.
  7. После каждого примера на иностранном добавить пример
    на русском языке.
  8. На последнем слайде (слайдах) указать литературу, интересные книги и статьи по теме. Ссылаться на Википедию не нужно. Должна быть хотя бы одна ссылка по теме доклада на статью с конференции Диалог (http://www.dialog-21.ru/) или конференции из списка на сайте NLPub, что-либо из этой статьи должно быть использовано в докладе. Ссылки оформлять по ГОСТу.
  9. Предоставить доклад в редактируемом формате преподавателю (PowerPoint или LibreOffice Impress) за 24 часа до выступления. Поправить доклад с учётом замечаний.
  10. Выступить с докладом в указанную дату.

*) Если вы хотите рассказать о какой-либо компьютерной программе или о каком-либо алгоритме, методе, технологии, связанными с обработкой текста и вычислительной лингвистикой (вместо тем докладов, перечисленных выше), то обсудите вопрос с преподавателем.

Ссылка на эту страницу на Google Docs: goo.gl/QpsdmI 

Ссылка на эту страницу на сайте Крижановского А. А. http://whinger.krc.karelia.ru/paper/cl/SlidesSpeechandLanguageProcessing.html