Interested Article - Джонс, Карен Спарк

Карен Спарк Джонс (член британской академии ; 26 августа 1935 — 4 апреля 2007) британский учёный в области информатики .

Спарк внесла значительный вклад в две отдельные области: информационный поиск (ИП) и обработка естественного языка (ОЕЯ). В последние годы своей жизни она занималась интеграцией этих направлений в основные блок-схемы ИИ . Её наиболее важным вкладом является создание концепции учёта весов слов обратной частоты документа (IDF), которую она описала в статье в 1972-м году . На сегодняшний день IDF используется во многих поисковых системах, как правило, в составе схемы TF-IDF .

Биография

Происхождение

Карен Спарк Джонс родилась в городе Хаддерсфилде графства Йоркшир в Англии . Её отцом был Оуэн Джонс — преподаватель химии, а матерью — норвежка Ида Спарк, которая переехала в Великобританию во время Второй мировой войны . Оуэн и Ида покинули Норвегию на одном из последних кораблей после немецкого вторжения в 1940 году.

Карьера

Карен Спарк Джонс обучалась в гимназии Хаддерсфилд, а затем в Кембриджском колледже с 1953 по 1956 года. Там изучала историю, но на последнем году обучения увлеклась философией (тогда она называлась Моральные науки ( англ. Moral Sciences )) и после окончания обучения приняла приглашение (англ.) на вступление в языковой исследовательский отдел Кембриджского университета (ЯИОКУ). Прежде чем перейти к исследовательской работе в области информатики, она недолго проработала учителем в школе.

Статья, написанная Спарк совместно с Мастерман и Нидхемом, и опубликованная в 1958 году, называется «Аналогия между машинным переводом и поиском в библиотеке» . В 1968 году Спарк перевели из ЯИОКУ в (англ.) , к тому времени она уже 3 года была сотрудником (англ.) , а затем стала членом Лондонского королевского общества . Там она начала свою карьеру в области ИП, в которой она стала мировым авторитетом.

До того, как Спарк была переведена в Кембриджский университет, она написала диссертацию на тему «Синонимия и семантическая классификация» в 1964 году при Кембриджском языковом исследовательском подразделении под руководством Маргарет Мастерман и её мужа, философом (англ.) . Эта работа сильно опережала своё время и была опубликована лишь двадцать лет спустя в статье по теме ИИ в Эдинбургском университете . На самом деле, это было первое применение статистических методов кластеризации для лексических данных. Это было амбициозной попыткой создать некоторое представление о примитивных понятиях машинного перевода на эмпирической основе. Алгоритмы, которые она использовала, были из теории о «сгустках» («Theory of Clumps»). Они были разработаны и использованы её мужем Роджером Нидхемом в его дипломной работе по автоматической классификации, и те, которые она использовала, когда начала работать в компьютерной лаборатории при Кембриджском университете. Основным источником вдохновения для Спарк был её муж Роджер Нидхем и её руководитель Маргарет Мастерман .

Концепция IDF

Карен Спарк Джонс внесла значительный вклад в области: ИП и ОЕЯ. , а также создала концепцию учёта весов слов обратной частоты документа (IDF), которую она описала в статье в 1972-м году. IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции. Учёт IDF уменьшает вес широкоупотребительных слов. Для каждого уникального слова в пределах конкретной коллекции документов существует только одно значение IDF.

Проводится ежегодная лекция «British Computer Society», названная в её честь . На протяжении её карьеры в области информатики, она пыталась привлечь женщин для работы в данной области (её лозунг — «вычисления слишком важны, чтобы оставлять их мужчинам»), а также была хорошим наставником для студентов .

Последние годы жизни

Карен Спарк Джонс умерла от рака 4-го апреля 2007 года в городе Уиллингеме графства Кембриджшир . Была организована и проведена встреча в компьютерной лаборатории Кембриджского университета, чтобы воздать дань памяти и уважения .

Личная жизнь

Карен Спарк Джонс была замужем за своим товарищем, учёным Кембриджского университета Роджером Нидхемом . Они построили свой дом в деревне (англ.) (около 3 км к западу от Кембриджа в графстве Кембриджшир, Англия). По утрам они работали дома, возвращаясь на своё рабочее место лишь после полудня. Они жили долго и счастливо в скромном деревянном доме на протяжении многих лет, пока шум от шоссе (англ.) не заставил их покинуть это место .

Почести

  • Член британской академии , в которой она была вице-президентом в феврале 2000 года;
  • Член AAAI;
  • Член ECCAI;
  • Стала президентом Association for Computational Linguistics в 1994 году.

Награды

  • (англ.) (1988)
  • (англ.) Award of Merit (2002)
  • ACL Lifetime Achievement Award (2004)
  • (англ.) (англ.) (2007)
  • ACM-AAAI Allen Newell Award (2007)

Примечания

  1. .
  2. , p. 1.
  3. , p. 1.
  4. , p. 2.
  5. , p. 3.
  6. .
  7. .
  8. .
  9. .
  10. .
  11. .
  12. .

Ссылки

  • Karen Spärck Jones. Synonymy and Semantic Classification (thesis published as a book) (англ.) . — Edinburgh University Press , 1986. — Vol. 1. — (Edinburgh Information Technology series).
  • (англ.) . (англ.) . — Massachusetts Institute of Technology, 2007.
  • (англ.) . Computer Laboratory, University of Cambridge (1 января 2010). — Professor Karen Spärck Jones was one of the pioneers in information retrieval (IR) and natural language processing (NLP). Дата обращения: 12 ноября 2013.
  • Karen Spärck Jones. // Journal of Documentation : Journal. — MCB University: MCB University Press ISSN 0022-0418, 2004. — Т. 60 , № 5 . — С. 493—502 .
  • (англ.) . (англ.) . — Butterworth & Co, 1981. от 13 ноября 2013 на Wayback Machine
  • Robertson, Stephen; Tait, John. (англ.) . — 59. — Wiley Online Library , 2008. — P. 852—854.
  • (англ.) . British Computer Society (23 мая 2013). — In Memoriam Karen Spärck Jones. Дата обращения: 12 ноября 2013.
  • (англ.) . The telegraph (24 апреля 2007). — Biography of the Karen Spärck Jones. Дата обращения: 12 ноября 2013.
  • (англ.) . The University of Sheffield (24 апреля 2007). — Biography of the Karen Spärck Jones which wrote by Yorick Wilks. Дата обращения: 8 декабря 2013.
  • Masterman, Margaret; Needham, Roger; Sparck Jones, Karen. (англ.) . — Proceedings of the International Conference on Scientific Information. — National academy of sciences, 1958. — P. 917—936.
  • (англ.) . Computer Laboratory, University of Cambridge (4 апреля 2007). — Meeting as a tribute to Professor Karen Spärck Jones. Дата обращения: 8 декабря 2013.
  • (англ.) . IEEE Spectrum (1 мая 2007). — Biography of the Karen Spärck Jones. Дата обращения: 19 декабря 2013.

Дополнительная литература

  • , IEEE Spectrum, May 2007

Ссылки

Источник —

Same as Джонс, Карен Спарк