Interested Article - Геометрический центр

Геометрический центр дискретного множества точек евклидова пространства (говоря статистическим языком — выборки) — это точка, в которой минимизируется сумма расстояний до точек множества. Геометрический центр обобщает медиану в математической статистике, которая минимизирует расстояния в одномерной выборке данных. Таким образом, геометрический центр отражает центральную тенденцию в пространствах высокой размерности. Понятие известно также по названиям 1-медиана , пространственная медиана , или точка Торричелли .

Геометрический центр является важной оценочной функцией сдвига в статистике , в которой это понятие известно как оценка L 1 . Поиск геометрического центра является также стандартной задачей при размещении объектов , где моделируется расположение объектов (производства или потребления) с целью минимизации транспортных расходов

Специальный случай задачи для трёх точек на плоскости (то есть m =3 и n =2 в терминах, описанных ниже) иногда описывается как задача Ферма. Она возникает при построении минимальных деревьев Штейнера и впервые была поставлена как задача Пьером Ферма , а решил её Эванджелиста Торричелли . Решение этой задачи известно теперь как точка Ферма треугольника . В свою очередь, поиск геометрического центра можно обобщить до задачи минимизации суммы взвешенных расстояний. Эта задача известна как задача Вебера , поскольку Альфред Вебер обсуждал эту задачу в книге 1909 года по вопросам размещения объектов . Некоторые источники вместо этого используют название задача Ферма – Вебера , но некоторые источники используют то же название для невзвешенной задачи

Весоловский дал обзор задачи геометрического центра. Смотрите статью Фекете, Мичела и Бойера с обсуждением обобщения задачи для случая недискретных множеств.

Определение

Формально, если задано множество, содержащее m точек , где все , геометрический центр определяется как

Геометрический центр

Заметьте, что здесь arg min означает значение аргумента , на котором достигается минимальная сумма. Это точка , для которой сумма всех евклидовых расстояний до , минимально.

Свойства

  • Для случая одномерного пространства медиана является геометрическим центром (если точек чётное число, геометрический центр может быть не единственным). Это потому, что одномерная медиана минимизирует сумму расстояний до точек .
  • Геометрический центр является единственным для всех случаев, когда точки не коллинеарны .
  • Геометрический центр для евклидового подобия , параллельного переноса и поворота . Это означает, что получится один и тот же результат, если найти образ центра при преобразовании, либо, применив то же преобразование ко всем точкам выборки, а затем уже найдя геометрический центр. Это свойство вытекает из факта, что геометрический центр определяется лишь исходя из попарных расстояний и не зависит от системы ортогональных декартовых координат . Для контраста, покомпонентная медиана для многомерных данных при вращении, в общем случае, не является инвариантом и зависит от выбора координат .
  • Геометрический центр имеет 0,5 . То есть до половины данных выборки могут быть недостоверными, но геометрический центр выборки остаётся устойчивой оценкой положения неиспорченных данных.

Специальные случаи

  • Для 3 ( неколлинеарных ) точек , если какой-либо из углов треугольника с вершинами в этих точках составляет 120° или больше, то геометрический центр — это вершина этого угла. Если все углы меньше 120°, геометрический центр — это точка внутри треугольника, которая составляет угол 120° с любой парой вершин треугольника . Эта точка известна как точка Ферма треугольника (если три точки коллинеарны, то геометрический центр совпадает с точкой, которая лежит между двумя другими).
  • Для 4 копланарных точек , если одна из четырёх точек лежит внутри треугольника, образованного тремя другими точками, геометрическим местом будет эта внутренняя точка. В противном случае четыре точки образуют выпуклый четырёхугольник , и геометрическим центром служит точка пересечения диагоналей четырёхугольника. Геометрический центр четырёх копланарных точек — это то же самое, что и единственная точка Радона для четырёх точек .

Вычисление

Несмотря на то, что понятие геометрического центра является простым для понимания, его вычисление вызывает трудности. Центроид треугольника (то есть его центр масс ), определяемый аналогично геометрическому центру как минимизация суммы квадратов расстояний до каждой точки, может быть получен с помощью простых формул — его координаты являются средним арифметическим координат точек. Однако такой простой формулы для геометрического центра не известно. Даже было показано, что не существует ни , ни точного алгоритма, использующего только арифметические операции и операции извлечения корней. Таким образом, существуют только аппроксимации для решения данной задачи .

Однако можно вычислить приближение к геометрическому центру, используя итеративную процедуру, в которой каждый шаг даёт более точное приближение. Процедуры этого типа могут получены из того факта, что сумма расстояний до точек выборки является выпуклой функцией , поскольку расстояние до каждой точки выборки является выпуклой функцией, а сумма выпуклых функций также является выпуклой функцией. Таким образом, процедура уменьшения суммы расстояний не может попасть в .

Один из подходов такого рода — алгоритм Вайсфельда ( ) является видом с меняющимися весами. Этот алгоритм задаёт множество весов, которые обратно пропорциональны расстояниям до текущего приближения, и вычисляет новое приближение, являющееся средним взвешенным точек выборки согласно этим весам. То есть

Метод сходится почти со всех начальных положений, но может завершиться неудачей, если приближение оказывается в одной из точек выборки. Алгоритм можно модифицировать таким образом, что он будет сходиться для всех начальных точек .

Бозе, Магешвари и Морин описали более изощрённую процедуру оптимизации для поиска приблизительного оптимального решения данной задачи. Как показали Не, Паррило и Стармфилс , задачу можно представить как задачу полуопределённого программирования .

Коэн, Ли, Миллер и Пачоки показали, как вычислить геометрический центр с произвольной точностью за почти линейное время.

Описание геометрического центра

Если точка y отлична от всех заданных точек выборки x j , то y является геометрическим центром тогда и только тогда, когда

Это эквивалентно

что тесно связано с алгоритмом Вайсфельда.

В общем случае y является геометрическим центром тогда и только тогда, когда существуют вектора u j , такие, что

где для x j y ,

а для x j = y ,

Эквивалентная формулировка этого условия

Обобщения

Геометрический центр можно обобщить с евклидовых пространств до общих римановых многообразий (и даже метрических пространств ), используя ту же идею, что используется для определения на римановых многообразиях . Пусть — риманово многообразие с функцией расстояния , пусть весов, в сумме дающих 1, и пусть наблюдений из . Тогда мы определяем взвешенный геометрический центр (или взвешенное среднее Фреше) точек данных

.

Если все веса равны, мы говорим, что является геометрическим центром.

Примечания

  1. Более общая задача о k -медиане задаёт вопрос о положении k центров, минимизирующих сумму расстояний от каждой точки множества до ближайшего центра.
  2. .
  3. .
  4. .
  5. .
  6. .
  7. .
  8. .
  9. .
  10. .
  11. .
  12. .
  13. .
  14. .
  15. ; . Выпуклый случай первым доказал .
  16. ; . Ранее Кокейн и Мельцак доказали, что точка Штейнера для 5 точек на плоскости не может быть построена с помощью циркуля и линейки
  17. .
  18. .
  19. .
  20. .
  21. .
  22. .

Литература

  • Chandrajit Bajaj. Proving geometric algorithms nonsolvability: An application of factoring polynomials // . — 1986. — Т. 2 . — С. 99–102 . — doi : .
  • // . — 1988. — Т. 3 . — С. 177–191 . — doi : .
  • // . — 2003. — Т. 24 , вып. 3 . — С. 135–146 . — doi : .
  • J. Brimberg. The Fermat–Weber location problem revisited // . — 1995. — Т. 71 , вып. 1, Ser. A . — С. 71–76 . — doi : .
  • R. Chandrasekaran, A. Tamir. // . — 1989. — Т. 44 . — С. 293–295 . — doi : .
  • Dietmar Cieslik. . — Springer, 2006. — Т. 17. — ISBN 9780387235394 .
  • E. J. Cockayne, Z. A. Melzak. // Mathematics Magazine . — 1969. — Т. 42 , вып. 4 . — С. 206–208 . — doi : . — JSTOR .
  • Michael Cohen, Yin Tat Lee, Gary Miller, Jakub Pachocki, Aaron Sidford. Geometric median in nearly linear time // Proc. 48th (STOC 2016). — Association for Computing Machinery , 2016.
  • Zvi Drezner, Kathrin Klamroth, Anita Schöbel, George O. Wesolowsky. The Weber problem // . — Springer, Berlin, 2002. — С. 1–36.
  • H. A. Eiselt, Vladimir Marianov. . — Springer, 2011. — Т. 155. — С. 6. — (International Series in Operations Research & Management Science). — ISBN 9781441975720 .
  • Sándor P. Fekete, Joseph S. B. Mitchell, Karin Beurer. On the continuous Fermat-Weber problem // . — 2005. — Т. 53 , вып. 1 . — С. 61–76 . — doi : . — arXiv : .
  • P. Thomas Fletcher, Suresh Venkatasubramanian, Sarang Joshi. The geometric median on Riemannian manifolds with application to robust atlas estimation // NeuroImage. — 2009. — Т. 45 , вып. 1 Suppl . — С. s143–s152 . — doi : . — . — PMC .
  • J. B. S. Haldane. Note on the median of a multivariate distribution // Biometrika. — 1948. — Т. 35 , вып. 3–4 . — С. 414–417 . — doi : .
  • Jakob Krarup, Steven Vajda. On Torricelli's geometrical solution to a problem of Fermat // IMA Journal of Mathematics Applied in Business and Industry. — 1997. — Т. 8 , вып. 3 . — С. 215–224 . — doi : .
  • Harold W. Kuhn. A note on Fermat's problem // . — 1973. — Т. 4 , вып. 1 . — С. 98–107 . — doi : .
  • Martin Lawera, James R. Thompson. Some problems of estimation and testing in multivariate statistical process control // . — 1993. — Т. 93-2. — С. 99–126.
  • Hendrick P. Lopuhaä, Peter J. Rousseeuw. // . — 1991. — Т. 19 , вып. 1 . — С. 229–248 . — doi : . — JSTOR .
  • Jiawang Nie, Pablo A. Parrilo, Bernd Sturmfels. Algorithms in Algebraic Geometry / A. Dickenstein, F.-O. Schreyer, A.J. Sommese. — Springer-Verlag, 2008. — Т. 146. — С. 117–132. — (IMA Volumes in Mathematics and its Applications).
  • L. Ostresh. Convergence of a Class of Iterative Methods for Solving Weber Location Problem // . — 1978. — Т. 26 , вып. 4 . — С. 597–609 . — doi : .
  • Frank Plastria. // IMA Journal of Management Mathematics. — 2006. — Т. 17 , вып. 4 . — С. 387–396 . — doi : .
  • P. G. Spain. // Mathematics Magazine. — 1996. — Т. 69 , вып. 2 . — С. 131–133 . — JSTOR .
  • Yehuda Vardi, Cun-Hui Zhang. The multivariate L 1 -median and associated data depth // Proceedings of the National Academy of Sciences of the United States of America. — 2000. — Т. 97 , вып. 4 . — С. 1423–1426 (electronic) . — doi : .
  • Alfred Weber. Über den Standort der Industrien, Erster Teil: Reine Theorie des Standortes. — Tübingen: Mohr, 1909.
  • G. Wesolowsky. // Location Science. — 1993. — Т. 1 . — С. 5–23 .
  • E. Weiszfeld. Sur le point pour lequel la somme des distances de n points donnes est minimum // . — 1937. — Т. 43 . — С. 355–386 .
Источник —

Same as Геометрический центр