Interested Article - Связность

Глобальное обсуждение

У проекта, по моим представлениям, довольно хорошо разработана справка; дежурные ботоводы время от времени сталкиваются с отдельными вопросами в случаях, если справка не прочитана, но в целом в проекте обсуждение менее активно, чем в большинстве других проектов, при том, что сам проект работает.

Тем не менее, на самом деле есть масса тем для обсуждения. К сожалению, я осознала, что не справляюсь с донесением кучи информации; зачастую потому, что в проекте включается какое-то временное решение, я думаю, что, пока оно временное, не надо его анонсировать, а временное становится постоянным. Переписка нескольких активных участников проекта постоянно идёт в почте, но очень не хватает коллективной мудрости.

Ниже речь как о технических вопросах, так и не о технических. Если вы прочтёте о проблеме, которую сами не умеете решать, может, вы знаете человека, который умеет, и попросите его помочь?

Текущее состояние

Сайт проекта переведён на 7 языков (английский, русский, украинский, белорусский-тарашкевица, эсперанто, литовский, португальский), частично готов немецкий перевод. Проект работает для 271 Википедии. Шаблоны расстанавливаются в русской, украинской и двух белорусских Википедиях, статистика загружается ещё в литовскую Википедию, а поляки используют для расстановки своими ботами отдельные файлы. Полностью настроенными считаются, помимо ru+uk+be+be-x-old+lt ещё осетинская, якутская, греческая и шведская Википедии — они выделены на сайте жирным, это значит, что у них есть хронологические статьи и мы умеем их определять. 65 Википедий считаются ненастроенными, так как мы не знаем, какие страницы у них являются неоднозначностями.

Что мы умеем

Мы умеем определять тупиковые, изолированные и некатегоризованные статьи разных видов, расстанавливаем и снимаем шаблоны при необходимости (в нескольких Википедиях). Информация собирается скриптом по имени Голем (используется разными ботами, в основном — Голем , РобоСтася , U-bot ), в последнее время шаблоны в рувики и be-x-oldwiki расстанавливаются автоматически (то есть без использования AWB; боты Голем и РобоСтася ). В рувики очень помогает KrBot , который расстанавливает некоторые шаблоны через 4 часа после создания статьи, а не раз в сутки, как боты, использующие Голема. На сайте ведутся списки изолированных статей , , (некоторые авторы не любят этот список, а некоторым он удобен; в том числе есть ); есть списки и , в которых есть ссылки на неоднозначности, и списки . Ещё есть « », в котором показано, где категории непоследовательны, и какие категории не категоризованы. Время от времени появляются разные дополнения к этому — скрипт AWB, решающий неоднозначности, скрипт, выделяющий и решающий неоднозначности, пояснения и ссылки с разных страниц интерфейса Википедии, и так далее. Википедии можно сравнивать между собой — и в « », правда, надо учитывать поле cluster size limit, оно означает, что если в какой-то Википедии есть изолированный кластер крупнее заданного размера, проект его не находит.

Особенности и проблемы

Технические задачи перечислены на странице Проект:Связность/Улучшение инструментов ; ниже расширенный, но выжатый пересказ. Очень нужны руки и головы для поиска решений.

  • Некогда на сайте были подсказки по связыванию статей — с помощью «интервики-шпиона» (если у изолированной статьи была интервика, бот шёл по ней-ним и смотрел, как в Википедиях на других языках ссылаются на эту статью, и либо давал список, либо подсказывал, какую статью надо написать) и с помощью гугл-подсказки (простым поиском по Википедии — не встречается ли это название в других статьях?). Ссылка на поиск осталась, но сломалось встраивание . Интервики-шпион пришлось отключить, так как на тулсервере, на котором базируется проект, резко ограничили предоставляемые ресурсы. В итоге сейчас подсказок почти что и нет, а их наличие было хорошо и важно.
  • Нетехническое Нужно поискать в ещё совсем ненастроенных Википедиях, нет ли у них аналога шаблона {{ disambig }} , и если есть, то сделать перенаправление с местного template:disambig на этот шаблон. Википедии после этого настроятся при ближайшем проходе бота :)
  • Сейчас очень сложно настраивать автоматическую расстановку шаблонов. Очень не хватает её для Википедии на украинском языке. Кроме того, описания правок сейчас делаются на английском языке, что не очень хорошо. Очень надо бы доделать этот момент.
  • Дизайнерское Как можно сделать более читаемой сравнительную таблицу и круговые диаграммы? Куда разместить ссылку на дружественный инструмент, который хоть немного может помочь в деле распутываний колец категорий? Что вы думаете об агрессивности раскраски важного скрипта ?
  • Переводческое Хотелось бы перевести сайт на большее количество языков, хотя сейчас это процесс относительно нелёгкий (текты здесь , нужно перевести в текстовом файле и прислать мне или Mashiah Davidson )
  • Нетехническое Может быть, есть что-то, чего я не вижу? Непонятные и незаметные правила, нелогичности, идеи? Может, у вас есть знакомые Википедии, которым нужна статистика ( в таком формате ) или даже расстановка шаблонов?

Мнения правда очень интересны. Спасибо заранее всем, кто выскажется. Львова Анастасия 13:15, 29 января 2012 (UTC) [ ]

Мнение участника Egor

  • Я попробовал гугл-поиск на тулсервере, он работает. Что касается интервики, то инструмент, видимо, полезный, но мне не совсем понятен алгоритм и глубина работы, возможно, это слишком высокая нагрузка. Тут нужно описать (дать ссылку на описание) как оно работает.
    Он сейчас работает как ссылка, а ранее это было встроенное окно. Нагрузка была — 4 гигабайта оперативной памяти, кажется :) Код , насколько я понимаю; можно особо привлечь внимание Машиаха, чтобы он описал былой алгоритм, но понятно, его надо как-то переделывать. Львова Анастасия 19:16, 30 января 2012 (UTC) [ ]
    Ну и самое простое- не обращать внимания на временные трудности. Я много времени провёл, работая с сиротами, чтобы понять, что же делать. Для подавляющего большинства статей и пользователей ни гугл, ни интервики не помогут. Нужны обобщающие статьи разного уровня обобщения. Без них связность остаётся самоцелью, к сожалению. А вот как развить дерево статей обобщения, я пока не осознал. -- Egor 22:41, 30 января 2012 (UTC) [ ]
    Вкратце, интервики-шпион работал так: для каждого языка после сбора данных об изолированных он анализировал интервики ссылки из них, а потом запускал несколько потоков (по одному на каждом из серверов s1, s2, ...), разыскивающих ссылки на эти интервики-партнёры, а из них обратные ссылки в язык-источник. Таким образом, схема работы была "каждый язык с каждым языком", или N^2 операций поиска. Код в файле iwikispy.sql. Идея в том, чтобы при анализе каждого языка складывать изолированные с интервиками в некую общую базу данных, и не отходя от кассы, анализировать, что можно сделать для других языков. Экономия в основном на постороении таблицы ссылок и выявлении дизамбигов. Я пока не рассматриваю эту задачу как сверхприоритетную и хочу сконцентрировать усилия на повышении стабильности работы (уменьшении времени работы запросов, часто убиваемых при высоком реплаге). Mashiah 13:04, 31 января 2012 (UTC) [ ]
  • Нетехническое. Тут наверное надо осознать, насколько это нужно делать "сверху". Есть ли краткое и понятное описание проекта связности и его инструментов на базовых языках и максимально доступные ссылки на эти описания для пользователей. Вероятно, для некоторых разделов проще обращаться к пользователям этих разделов через форумы, пусть даже на английском?.
    Некогда я прошлась по всем ненастроенным Википедиям с просьбами. Как правило, это маленькие проекты, в которых не нашлись достаточно живые души. Львова Анастасия 19:16, 30 января 2012 (UTC) [ ]
    Ну так о чём сожалеть? Википедия развивающийся проект, и именно русская культура может обеспечить безграничное его развитие. Время всё расставит на свои места. Даже если мы заговорим на другом языке (хотя вряд ли). Умирающие умрут, или станут песочницами с ограниченными целями. -- Egor 22:41, 30 января 2012 (UTC) [ ]
    Мы не жалеем, дело в том, чтобы порядок был и всё везде совсем работало ;) Львова Анастасия 11:58, 31 января 2012 (UTC) [ ]
  • А в чём сложность настройки простановки шаблонов? Отсутствие нужных параметров в шаблонах укрвики? или разночтения алгоритмов применения параметров?
    У разных проектов бывает своя специфика. Например, в ukwiki уважают шаблоны «nobot», и более трепетно, кажется, относятся к тому, чтобы описания правок были на родном языке. Описания правок сейчас "Мелогом" (скриптом-расстановщиком шаблонов) делаются только на английском языке, и не реализовано ничего типа Википедия:ConnectivityProjectInternationalization . Львова Анастасия 19:16, 30 января 2012 (UTC) [ ]
    Ну так это только должно нас подвигать не только разрабатывать инструменты, но и грамотно и увлекательно объяснять, в том числе и нулевым новичкам, для чего это нужно. Я правильно понимаю, что это обсуждение вызвано некоторым "кризисом жанра" в проекте? Так наши основные цели пока не достигнуты, дела навалом. Лишь бы эти дела были в радость. Хорошо, когда работает "Большая Зелёная Кнопка", но, боюсь завалы она не уберёт, только замаскирует. -- Egor 22:41, 30 января 2012 (UTC) [ ]
    Не совсем поняла, что имеется в виду под «кризисом жанра» и БЗК. Не хватает рук для ряда идей, и лично мне не вполне сейчас понятно текущее состояние, хочется выслушать новые идеи, чтобы понять, надо ли что-то менять и можно ли что-то менять в сторону большего развития. Львова Анастасия 11:42, 31 января 2012 (UTC) [ ]
    Наверное, здесь две проблемы для обсуждения. Первая - как сделать чтобы сообщество постоянно видело проблему сирот и сегментации (простота и понятность описания проблемы и понятность работы с инструментарием). Возможно, на портале Вики сделать почётче часть "Нужно сделать", выделить постоянные наиболее важные проблемы, есть ведь и кроме сирот проблемы? Может, вообще на портале сократить эти маловразумительные списки до читаемого состояния, а конкретные проблемы вынести в подстраницы? Вторая - как работать в проекте Связности. Ещё раз попытаюсь - основная проблема в острой нехватке обобщающих статей, к которым можно было бы привязывать сирот, достойных остаться в википедии. Как описать алгоритм определения таких статей, пока не знаю. Возможно, через категорию сироты и заглавную статью в этой категории (если есть, а если нет - то включать в список "К созданию"? -- Egor 21:55, 31 января 2012 (UTC) [ ]
  • Сравнительную таблицу не нужно делать удобнее, она вполне читаема и понятна, если уж до неё дошёл любопытный нос :-) Красивые персональные диаграммы же на основе таблицы можно делать и самому. У меня претензий к дизайну техинструментов нет. Ссылки на инструменты надо ставить везде, где только можно, и в википедии, и на тулсервере. Циклы категорий одна из трудно определяемых на местности задач (помнится, как развязывали цикл с морями Израиля :-)). К показанному инструменту хотелось бы увидеть пояснение, я с первого раза не понял как это работает и как применять.
    Вопрос «где» имелся в виду вида «на такой-то страничке сайта вот в этом-то углу мы ставим ссылку на дружественный инструмент с таким-то пояснением». Красивые персональные диаграммы же на основе таблицы можно делать и самому — то есть страница pie charts не нужна?.. Львова Анастасия 19:16, 30 января 2012 (UTC) [ ]
    Ну что я буду девушку учить, где бантик навесить :-). А диаграмм указанных, я, честно, не нашёл... :-(. Только графики. Можно прямую ссылку, о чём речь? -- Egor 22:41, 30 января 2012 (UTC) [ ]
    Насколько я понял, речь идет об этих « ». Как по мне, работать с графиками можно только для top-10 вики, остальные становятся настолько маленькими, что понять в них что-то трудно. Наличие на одной странице всех "пирогов" тоже сомнительно. Да и сами графики как-то мало информативны. Ну всего-то 3 показателя... Таблица намного полезнее. Если графики оставлять, то лучше их строить динамически, по кнопке, добавив в таблицу чекбоксы "сравнить" (или как-то так...) Сколько пользователь отметил строк, столько графиков и получил. Будет сравнивать то, что захочет сравнить. А в самой таблице я предлагаю, во-первых, локализовать "шапку", во-вторых, каждый заголовок колонки сделать ссылкой на описание соответствующего показателя. Хотя бы в виде тултипа. Рост/уменьшение соответствующего показателя можно подкрашивать красным/зеленым (текст или фон) - будет сразу наглядно видна тенденция улучшения/ухудшения. Dimich 10:20, 31 января 2012 (UTC) [ ]
    Что такое тултип?.. Львова Анастасия 11:42, 31 января 2012 (UTC) [ ]
    Желтенькое всплывающее окошечко с подсказкой, появляющееся при наведении курсора мыши на элементы html-разметки с атрибутами alt (например у изображений) или title. Dimich 12:01, 31 января 2012 (UTC) [ ]
  • Нужны, насколько понимаю, переводы текстов на другие языки, которых пока нет в таблице? Тут помочь не могу.
    Даже знакомствами? :) Львова Анастасия 19:16, 30 января 2012 (UTC) [ ]
    Ну алтайские языки даже вики своей не имеют :-). -- Egor 22:41, 30 января 2012 (UTC) [ ]
  • Статистикой я пользуюсь, когда были завалы, это был один из самых полезных инструментов. Что касается автоформирования категорий и тем более текстов-пояснений, то это кажется излишеством. Количество и качество категорий вроде выбрали исходя из глубины кластеров и сиротства, они же временно опустевшие не удаляются по мере работы с ними? А текст надо написать один с толкованием цифровых обозначений сирот и кластеров. Или оставить в каждой категории свой. При решении каких-то расширений (наверное, о них и речь, о кластерах в несколько десятков статей?) нужны не категории и описания (зачем плодить сущности?), а структурированные рабочие списки для желающих по запросу. Заставлять же тулсервер лопатить википедию необходимости пока не вижу.
  • В целом - проект очень важный и полезный, я всеми силами и возможностями всегда его поддерживал, поддерживаю и надеюсь продолжать. Вероятно, нужно обсуждать и финансово-организационное участие Фонда и НП ВМ-РУ в такой важной работе. -- Egor 18:30, 30 января 2012 (UTC) [ ]
    Признаться, это обсуждение во многом на это ориентировано. Надо понять, сможем ли мы изыскать своих новых программистов, и есть ли задачи, касающиеся не исключительно наличия команды программистов. Львова Анастасия 19:16, 30 января 2012 (UTC) [ ]
    Тут очень важно сформулировать сначала "мечту", что же мы хотим от технической реализации, и кто это "мы". Для кого будут инструменты и цели их работы. Если это действительно главное, то и нужно собрать в удобной форме "что хотелось", "что было", "что есть" и "чего хочется". Я так полагаю, что глубина на первый десяток анализа сирот и кластеров мала, по-хорошему, нужно изредка шерстить всю вики на предмет сегментации. Также по-прежнему полагаю, что проект выявил излишнюю высоту дерева категорий, его нужно подсекать, а для этого нужен внятный анализ длинных цепочек. Видимо, нужно начинать писать вариант проекта создания инструментария. -- Egor 22:41, 30 января 2012 (UTC) [ ]
    Сейчас по умолчанию проверяется кластер 20, считается, что обычно бо́льшие кластеры находятся редко. Есть возможность шерстить всю Википедию, Голем это умеет, но это требует сейчас таких ресурсов, которые тулсервер искуственно не даёт. А можно услышать идеи — кому и что хочется, о каком инструментарии речь? Я могу составить схему вопросов, на которые нужны ответы, но мне интересны именно мнения, как можно ответить на эти вопросы :) Львова Анастасия 11:42, 31 января 2012 (UTC) [ ]
    Предлагаю помощь в качестве программиста. Могу предложить большой практический опыт разработки веб-приложений (C#, php, javascript, sql, html). Готов общаться по e-mail, через страницу обсуждения. "Список добрых дел" проекта сейчас выглядит как меморандум намерений, поэтому нужна детализация заданий, обсуждение и общение. Dimich 10:20, 31 января 2012 (UTC) [ ]
    Ура! :) Сейчас обращу внимание Машиаха. Львова Анастасия 11:42, 31 января 2012 (UTC) [ ]
    Ну, раз пошла такая пьянка, предстоит углубление в то, как и что работает. Я бы предложил делать это медленно и постепенно, получая удовольствие от решённых небольших задач на этом пути. Наиболее актуальной задачей мне представляется локализация описаний правок и (затем) локализация всех правок в мелоге, т.е. замещение скриптов на perl. Локализация описаний правок даёт нам возможность, наконец, заняться автоматизацией правок в uk и pl. В контексте описаний правок главная задача - дать участникам википедии возможность задавать текст описания правок через википедию, а не через svn. К сожалению, подстановка шаблона в поле описания изменений не работает, а так бы хотелось... Таким образом, главная задача - продумать, где и как должны задаваться описания правок, на какой странице вики. При этом нужно думать о том, чтобы это было удобно как пользователям, так и скриптам (имя страницы должно быть легко вычислимым, например, подстраница Википедия:ConnectivityProjectInternationalization ). В будущем можно было бы также локализовывать и сам сайт связности. Что касается общения, мой email в меню "письмо участнику". Mashiah 12:48, 31 января 2012 (UTC) [ ]
    Нужно учитывать, что дерево категорий строится не по кратчайшим путям. Не факт, что категория с самого низа ёлки не связана с категорией "Всё" прямым включением. Всилу особенностей алгоритма анализа графа, мы на каждом слое находим те кластеры, до которых других более коротких путей не существует. Mashiah 12:53, 31 января 2012 (UTC) [ ]

Мнение участницы Хомелка

Попробую высказать своё мнение, по пунктам. Во-первых, про то, что уже хорошо. Таблица сравнения разделов, на мой взгляд, прекрасна, в ней есть всё, что необходимо. Разные статистики по авторам, категориям, etc. это тоже всё достаточно удобно и мною активно используется.

Теперь про то, что требует допила. Сравнение «в пирогах» — это может, и симпатично, но для маленьких разделов в нынешнем виде абсолютно не удобно, особенно для бевики, потому что доля изолированных у нас очень мала и в существующем масштабе увидеть там ничего не получится при всём желании.

И, наконец, про помощь. Что касается шаблона {{ disambig }} в разных разделах. Я прошла по всем интервикам в рувичном шаблоне и сделала штук 25 перенаправлений по ощущением, засада у меня вышла только с арабским и немецким разделами (что-то там технически у меня не выходит, увы). Если бы увидеть где-то список Википедий, где нужно создать перенаправление, то я готова ещё помочь. По поводу скрипта подсветки неоднозначностей, скажу только за бевики. Мои попытки установить его хотя бы гаджетом не удались, поэтому буду очень благодарна, если кто-то подскажет мне, в чём ошибка. Вот эта страница выглядит симпатично, но очевидно, что при увеличении количества переводов, она слишком расползётся. Будет разумно, если столбцы и строки прямо сейчас поменяют местами. Ну и как бонус, сделала перевод на белорусский язык, выслала только что почтой.-- Хомелка :) / обс 10:57, 31 января 2012 (UTC) [ ]

Виновата. Вот список Википедий, в которых нужна помощь: , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , (подвал на сайте Связности).
За перевод спасибо! Сейчас займусь подключением :)
Надеюсь, про подключение скрипта кто-нибудь подскажет :( Сейчас привлеку внимание. Львова Анастасия 11:48, 31 января 2012 (UTC) upd. Обсуждение Википедии:Гаджеты/Выделение неоднозначностей#bewiki [ ]
koi ушёл из списка недавно. Mashiah 13:25, 31 января 2012 (UTC) [ ]
Кстати, теперь, если в вики нет шаблона вроде {{ disambig }} , но есть категория для дизамбигов, можно просто проставить у этой категории интервику в . Mashiah 13:26, 31 января 2012 (UTC) [ ]
Нашёл кое-что для lbe: Шаблона нет, но его употребляют. Mashiah 14:05, 31 января 2012 (UTC) [ ]
+ ky: . Mashiah 14:42, 31 января 2012 (UTC) [ ]
+ rw: Mashiah 14:50, 31 января 2012 (UTC) [ ]
+ na: Mashiah 15:07, 31 января 2012 (UTC) [ ]
+ ha Mashiah 15:31, 31 января 2012 (UTC) [ ]
hak, new, ps, za; в остальных такого нет. Львова Анастасия 15:55, 31 января 2012 (UTC) [ ]
Почему-то в списке не было az и nv, создала и там, на всякий случай :)-- Хомелка :) / обс 21:44, 31 января 2012 (UTC) [ ]
Попробовала поменять столбцы и строки местами в таблице — она расползлась уже сейчас. Увы. Львова Анастасия 13:46, 31 января 2012 (UTC) [ ]

Предложение

Может ли бот выставлять на отдельную страничку списки новых сирот , т.е. статей, определённых им как сирота при каждом новом прохождении. Желательно, чтобы эти статьи находились бы в отдельном списке хотя бы неделю. На тулсеревере есть категория по дате создания, но она начинается с самых старых статей и добраться до свежих сирот практически невозможно. Учитывая, что значительная часть новых сирот появляется при переименовании статей и создании на старом месте неоднозначностей, данная мера позволит хотя бы остановить (или сильно замедлить) появление новых страниц сирот. Т.е., можно было бы заходить на эту страничку время от времени и разгребать новых сирот, созданных из-за лени участников, переименовавших статьи, но не переставивших на них ссылки. И можно будет спокойно разбираться с древними завалами-- Фидель22 16:14, 22 февраля 2012 (UTC) [ ]

Поскольку бот сам нуждается в этих данных для простановки и снятия шаблонов, он их собирает, и они доступны по . В архиве много всего интересного. Mashiah 21:02, 24 февраля 2012 (UTC) [ ]
у меня по ссылки какая-то абракадабра...-- Фидель22 22:06, 24 февраля 2012 (UTC) [ ]
В настоящий момент система не работает из-за поломки тулсервера. -- 22:15, 24 февраля 2012 (UTC) [ ]
Рейв, не путай неработающую базу с работающим хостингом, когда отвечаешь :) Львова Анастасия 09:13, 25 февраля 2012 (UTC) [ ]
Там архив в формате 7z, если его распаковать, то можно найти все данные по изменениям на текущий день (точнее, на тот день, в который работал тулсервер в последний раз). Если открывается как текст, то сохраните его к себе на компьютер как файл с расширением 7z.
Правда, это не совсем то, о чём Вы просите. Машиах, может, сделаешь ссылку на «последнюю страницу» при сортировке по дате на сайте? Львова Анастасия 09:13, 25 февраля 2012 (UTC) [ ]
Спасибо. Я открыл. В архиве 14 файлов - непонятно который из них содержит свежих сирот. Ссылка на последнюю страницу при сортировке по дате действительно была бы удобнее.-- Фидель22 16:53, 26 февраля 2012 (UTC) [ ]
Да, это можно. Сделаю, как только решу проблему с ноутом. Mashiah 17:17, 26 февраля 2012 (UTC) [ ]
Нужно только учитывать, что эти два списка не есть одно и то же. Один упорядочивает по дате создания, другой даётся в момент превращения в изолированные. Mashiah 20:09, 26 февраля 2012 (UTC) [ ]
deset — список новых тупиковых, derem — «больше не тупиковые», orem — больше не изолированные, ncaset и ncarem — (не)категоризованные, а все _1, _1_1 и так далее — как раз новые изолированные. Но в общем да, сложно. Львова Анастасия 17:44, 26 февраля 2012 (UTC) [ ]
  • хотел после прохождения бота почистить новых сирот, но архив не обновился. Что делать?-- Фидель22 22:42, 2 марта 2012 (UTC) [ ]
  • Коллеги, мне кажется очень неудобным: сперва качать архив, после его открыть и обнаружить 13 текстовых файлов. Нужно иметь решимость, чтобы копировать руками все эти названия. Быть может, возможно сделать одну wiki-страницу? -- Gruznov 20:48, 15 мая 2012 (UTC) [ ]
    Идея хороша, но позвольте поинтересоваться: а в чём сакральный смысл работы именно с новыми статьями-сиротами? По опыту работы проекта они-то как раз сами более-менее рассасываются, и двадцатитысячный корпус статей-сирот имеет более-менее постоянное ядро тысяч так на 15-18. Вот его-то по-хорошему и надо разгребать-разгрызать, но там каждый случай зачерствел и твёрд как научный гранит. -- 21:16, 15 мая 2012 (UTC) [ ]
    По состоянию на 7 февраля 2013 года, больше 1000 статей было создано за последние 38 дней. За некоторые года меньше. Страница со «свежими» сиротами будет полезна и тем, что в нее будет попадать много статей с вопросами по значимости, на которые никто не ссылается-- F ire W ire 19:46, 7 февраля 2013 (UTC) [ ]

Что случилось с мускулом?

Работаю над своими статьями в сторону улучшения по инструменту создатели изолированных статей, однако что-то он в последние дни завис. Что за баг с базой данных? 102RB 19:58, 24 февраля 2012 (UTC) [ ]

Тулсервер крайне нестабилен в последнее время. Mashiah 20:59, 24 февраля 2012 (UTC) [ ]

Вопрос про "транзитивность"

Коллеги,

подскажите, пожалуйста: вот у меня категория Фармация находится в кат. Медицина. А Фармакология — и в Медицине, и в Фармации. Это допустимо, или надо убрать? Хотелось бы оставить именно так, но я не учил теорию множеств и нахожусь в некоторой растерянности. Akim Dubrow 23:08, 3 марта 2012 (UTC) [ ]

Мне не очень нравится, когда включают в категорию и в её подкатегорию - это лишь личное мнение. Что касается теории множеств, она здесь не применима. Это теория категорий. В качестве примера, если некая статья относится к категории "Изолированные статьи", а эта категория относится к категории "Специальные категории", то эта статья, конечно же, специальной категорией не является. Mashiah 20:39, 5 марта 2012 (UTC) [ ]
Честно говоря, в кат. Фармация (да и в Психиатрия) сейчас такой бардак, что это незначительное сознательное отступления от иерархичности — сущий пустяк. =) Спасибо разъяснение, а то я недавно недоглядел, и устроил закольцовку категорий, с тех пор отношусь с большой опаской к их категоризации. Со статьями-то несколько проще. Akim Dubrow 21:28, 5 марта 2012 (UTC) [ ]

Саботаж инструментов проекта?

Обращаю внимание участников проекта на появление массовых правок такого типа: , , . То есть выведение статей из категории тупиковых путём викификации единственного слова. — Ivan A. Krestinin 21:32, 21 мая 2012 (UTC) [ ]

Ничего криминального тут нет. Шаблоны {{ тупиковая статья }} и {{rq|wikify}} несут всё-таки разные функции. От таких правок статьи действительно перестают быть тупиковыми, и это хорошо. -- 21:57, 21 мая 2012 (UTC) [ ]

Как правильно связывать статьи?

Добрый день! На моей возник спор о том, как (не) следует связывать статьи. Не могли бы вы разъяснить, как в данной ситуации будет лучше для проекта. Спасибо-- Alexandronikos 05:54, 16 октября 2012 (UTC) [ ]

Отвечу у Вас. Львова Анастасия 07:38, 16 октября 2012 (UTC) [ ]

Проект:Связность и Google

Выдержка из почтовой рассылки "wiki-research-l":

On Thursday, October 25, 2012, Piotr Konieczny wrote:

So it is no surprise when Wikipedia article comes up high in google ranking (моё выделение А.К. ). But occasionally a Wikipedia article will NOT be highly ranked, and will appear only in google 20-30+ or even further down the line . Any idea what makes Google dislike certain Wikipedia articles?

There are a bunch of factors. Two that would presumably play a role: Better linking for other topics than the Wikipedia article, the amount of people clicking on the Wikipedia article when it appears in search results, and the content found on the page. Example: Stubs have less content, are less likely to be clicked on and are not likely to be linked to. All bad conditions for optimal SEO. Sincerely, Laura Hale

Вероятно, действительно так: улучшение связности отдельно взятой статьи повышает её позицию в результатах поисковых систем, основанных на PageRank или аналогичных алгоритмах. Экспериментально это не проверялось, но похоже на правду. :) -- Andrew Krizhanovsky 06:52, 25 октября 2012 (UTC) [ ]

Если я правильно помню, это было в моём докладе полякам в 2010 году ;) Это всё в рамках подготовки к рассказу студентам найдено? Львова Анастасия 07:57, 25 октября 2012 (UTC) [ ]
Скорее, это тема в голове после рассказа крутится и сам собой дополнительный материал подбирается... :) -- Andrew Krizhanovsky 08:11, 25 октября 2012 (UTC) [ ]
Ой, очень интересны подробности — что это были за студенты, что это было за занятие да как восприняли. Львова Анастасия 08:23, 25 октября 2012 (UTC) [ ]
Студенты 5-го курса ПетрГУ , предмет называется "Интернет-математика", а рассказываю я там про то, что мне интересно, в основном темы из вычислительной лингвистики. Вопросов, к сожалению не было... :( Cтуденты мои ещё начинающие википедисты. Вот темы (на выбор) для написания статьи в течение семестра: . Пока что особо хвастаться нечем, по-видимому, большая активность будет к зачётной неделе. :) -- Andrew Krizhanovsky 11:47, 25 октября 2012 (UTC) [ ]
Здорово! На всякий случай, если это не попадалось на глаза ранее: Львова Анастасия 11:53, 25 октября 2012 (UTC) [ ]
Спасибо! Когда что-то напишем, то отмечусь там. -- Andrew Krizhanovsky 12:04, 25 октября 2012 (UTC) [ ]

Застрял почему-то в сиротах, хотя уже год как ссылка на него имеется. Что-то заржавело в боте? WBR, BattlePeasant 13:24, 21 февраля 2013 (UTC) [ ]

Если изволите искать ржавчину, то по всем признакам заржавели . Львова Анастасия 04:07, 31 мая 2013 (UTC) [ ]
Спасибо, примерно понял ситуацию. Странно конечно, как такие перманентные рассинхронизации с основной БД возможны. WBR, BattlePeasant 14:56, 31 мая 2013 (UTC) [ ]

См. ЛС и сегодня на ВП:ВУ . Что/кто это? Retired electrician (talk) 17:34, 17 июля 2013 (UTC) [ ]

Очевидно, чей-то виртуал для разделения вклада. -- 20:22, 17 июля 2013 (UTC) [ ]

Тулсервер

Инструмент на тулсервере, позволяющий участникам найти их изолированные статьи, не работает, не перенаправляет и ссылки не даёт.-- Arbnos 23:46, 28 января 2014 (UTC) [ ]

Да, проблема известна. Она связана с общим вымиранием тулсервера и переездом на Wikimedia Labs. -- 10:51, 29 января 2014 (UTC) [ ]
А кто хозяин? -- Akim Dubrow 11:08, 29 января 2014 (UTC) [ ]

Чей-то робот работает?

Здравствуйте. В укВП работала РобоСтася, но она с нового года не ходит. Если возможность у кого-то запускать туда своего робота, который в руВП работает по связности? Yakiv Glück 02:04, 10 марта 2014 (UTC) [ ]

Вики-Данные

Обсуждение:Золото (значения) : Все ссылки на других языках ведут на статьи о дизъюнкции. 14:14, 15 октября 2014 (UTC)

подтверждаю Золото (значения) имеет интервики ( Idot 05:46, 18 октября 2014 (UTC) ) [ ]

Обсуждение проекта:Адмиралтейство#Проблема с интервиками

На данный момент Корабль определяется в статье в трёх вариантах (в т.ч. невооружённые суда), при этом имеет интервики на .

Судно определяется как любое плавсредство от водного велосипеда до танкера, но имеет интервики на , который строго ограничен крупными судами (никаких !). , в свою очередь, совсем не Лодка , и в английской терминологии определяется простым способом: судно, способное находиться на другом судне - boat, неспособное - ship.

За бортом остались (нет русской интервики) и плавсредство (нет интервик).

Надо что-то делать, . -- Igel B TyMaHe ( обс ) 19:58, 18 сентября 2014 (UTC

то есть проблема с inter-wiki на wiki-data повесместна ( Idot 05:46, 18 октября 2014 (UTC) ) [ ]

Не пашет connectivity на labs

По в верхнем углу статьи вижу ошибку "No webservice". Ig natus 21:29, 3 января 2015 (UTC) [ ]

Малоактивный?

@ Ping08 : приветствую, а почему ? Я например, не прекращал работу в рамках данного проекта по улучшению связности Википедии. — Ivan A. Krestinin 16:24, 29 августа 2015 (UTC) [ ]

@ Ivan A. Krestinin : Очень мало кто над ним работает, обсуждение неактивное, Задача недели , последний раз обновлялась 9 января 2014‎, Изолированная подсказка, Связность дерева категорий и т.д. Не работают инструменты. Что-то я не увидел никаких признаков активности проекта -- Ping08 обс 16:33, 29 августа 2015 (UTC) [ ]
Голем и связанные с ним странички (например, Задача недели) к сожалению умер вместе с тулсервером, я к сожалению в этой части проекта разбираюсь мало, хотя надо будет попробовать всё-таки разобраться. Однако даже и без этой части мой бот исправно выполняет задачи связанные с этим проектом и активность у него немаленькая. Потому по-моему рановато объявлять проект малоактивным. — Ivan A. Krestinin 17:04, 29 августа 2015 (UTC) [ ]
@ Ivan A. Krestinin : Снимать шаблон об неактивности проекта? А кто-нибудь еще коме вас сейчас работает в рамках данного проекта? -- Ping08 обс 17:40, 29 августа 2015 (UTC) [ ]
Снимите лучше. Работает ли ещё кто-нибудь прямо сейчас — не знаю. Сейчас вообще лето, в ВП в принципе затишье, если не считать инициатив некоторых госструктур. — Ivan A. Krestinin 18:25, 29 августа 2015 (UTC) [ ]
@ Ivan A. Krestinin : Похоже, что только вы работаете в рамках данного проекта, потому что никто не написал кроме вас в обсуждение проекта, по поводу установки шаблона «Этот проект неактивен». Возможно что сюда никто кроме вас не заходит. Лето уже заканчивается, послезавтра уже осень. -- Ping08 обс 21:33, 29 августа 2015 (UTC) [ ]
  • Связность — дело нужное. Но без бота в этом проекте, к сожалению, всё-таки мало смысла. — Vort 05:09, 30 августа 2015 (UTC) [ ]
  • проект обозначен "малоактивный" потому что те кто ставит шаблон о "не активности" смотрит не на активность участников проекта, а на то как часто ведутся обсуждения на странице проекта ( Idot 05:39, 30 августа 2015 (UTC) ) [ ]

Автоматическая девикификация удалённых статей

Начала работать. См. шаблон:Девикифицировать вхождения . В текущем виде — весьма вредная с точки зрения связности штука. Начал Обсуждение шаблона:Девикифицировать вхождения#Нужность девикификации , прошу высказаться заинтересованных. -- be-nt-all ( обс ) 06:29, 10 сентября 2016 (UTC) [ ]

Древо категорий по канцелярским товарам

Я создал категорию «Производители письменных принадлежностей», но не совсем понимаю, как правильно присвоить категории производителям канцелярских товаров. Если компания, кроме перьевых ручек, производит другие письменные принадлежности, нужно ли её включать также и в категорию «Производители письменных принадлежностей» (материнская категория для категории «Производители перьевых ручек»)? Нужно ли компанию из категории «Производители письменных принадлежностей» включать также и в категорию «Производители канцелярских товаров» (материнская категория для категории «Производители письменных принадлежностей»)? -- Pavlovskteam ( обс. ) 04:28, 5 апреля 2019 (UTC) [ ]

Циклы в дереве категорий на август 2020

Здравствуйте. Участник Adamant.pwn проанализировал дерево категорий рувики и обнаружил следующие циклы категорий:

Приглашаю к работе. Для визуализации удобно использовать . Просто допишите в адресной строке браузера нужную категорию. — ( обс. ) 08:07, 10 августа 2020 (UTC) [ ]

Интервики-конфликт

Эта русскоязычная для интервики-ссылок использует элемент из Wikidata, а вот англоязычная статья использует совсем другой: В результате сделать в этой статье полный список ссылок на другие языки не представляется возможным. Полагаю, логичнее оставить тот, который в английской статье, а Q3434372 удалить. Не знаю, как это сделать. Кто знает, рассмотрите возможность исправить.

Внешние ссылки ведут не туда, куда должны

Похоже, тот сервер, на который ведут почти все внешние ссылки этой статьи, был перемещён. А редирект поставили без напряжения сил — просто на одну и ту же новую страницу. Кто в теме этих ссылок, прошу перепроверить и по возможности поправить. Nikolay Komarov ( обс. ) 18:10, 28 августа 2020 (UTC) [ ]

В основном это касается инструментария проекта. К сожалению, описанная вами проблема — следствие смерти Тулсервера и основных инструментов проекта вместе с ним. Сейчас ведутся работы по созданию новых инструментов, Ссылки пока оставлены в надежде на мизерный шанс починки предыдущего арсенала. Если есть конкретные вопросы по работе проекта — можете задавать, например, здесь. — ( обс. ) 09:57, 29 августа 2020 (UTC) [ ]
@ : у инструментов был закрытый исходный код? — Vort ( обс. ) 10:03, 29 августа 2020 (UTC) [ ]
У инструментов открытый исходный код. Но количество владеющих соответствующими языками программистов, готовых заняться запуском существующего кода на новом хостинге, в данный момент равно нулю. — ( обс. ) 10:41, 29 августа 2020 (UTC) [ ]
Языки обычно похожи. Ну кроме ассемблера, руби, раста, лиспа. Остальное более-менее одно и то же. Хостинг же стоит брать всё тот же — Toolforge. Проблема разве что может быть в том, что за время неактивности разработчиков (или мейнтейнеров) мог сильно поменяться API Mediawiki и инструмент придётся дописывать. Там один большой кусок кода или разбитый на части по функциям? Можно ли попробовать завести часть? Я могу глянуть на состояние кода и написать сюда свою оценку его состояния. Но сроков никаких дать не могу. Можете дать ссылку на код, который надо бы запустить? Чтобы у меня была отправная точка. — Vort ( обс. ) 11:17, 29 августа 2020 (UTC) [ ]
. Диалог разработчиков есть тут . Если вкратце, то одна часть кода (Голем) анализирует дамп Википедии, отыскивая изолированные и прочие целевые статьи, а другая часть кода (Мелог) — это бот, который берёт те первичные результаты работы и согласно им идёт по списку статей Википедии, устанавливая/снимая шаблоны. — ( обс. ) 14:44, 29 августа 2020 (UTC) [ ]
Ухх, мешанина из sh, php, sql, c#, perl. Может, ещё что-то пропустил. Теперь понятно, почему было мало желающих в это вникать. Ну я попробую завести. Начну с Голема. Трогать шаблоны кодом десятилетней давности пока что не стоит. — Vort ( обс. ) 15:19, 29 августа 2020 (UTC) [ ]
Как я понял, работа Голема основана на трёх базах данных: собственной, википедийной и тулсерверной. Собственную он сам создаёт, сам пользуется, вроде тут проблем быть не должно. Википедийную, теоретически, можно собрать из дампов. Но формат базы с момента последних запусков Голема мог поменяться. Самая большая проблема с третьей, тулсерверной, базой. Её нет. Вполне может быть, что у Тулфорджа есть аналогичная база и после адаптации её может будет подключить к Голему. Если же нет, то базу надо формировать вручную. Вроде бы, там никаких особо уникальных данных не было, так что можно даже попробовать забить её произвольными данными. Но главный вывод таков: без модификаций Голема не запустить. Я буду ещё смотреть, что с ним можно сделать. Попробую наполнить основную базу из дампа, поставить заглушки на тулсерверную, но что из этого получится — не знаю. — Vort ( обс. ) 21:15, 29 августа 2020 (UTC) [ ]
@ : удалось запустить основную часть функций Голема на примере базы be_x_old : . Для этого пришлось создавать с нуля таблицы language , namespacename и wiki базы toolserver , а также исправлять и адаптировать SQL код для поддержки MySQL 8й версии. Я хотел бы выложить на GitHub те модификации, которые я сделал в коде, но у меня не получается скачать репозиторий по той ссылке, которую рекомендует Gerrit. Может ли кто-нибудь скачать и переслать мне архив с git репозиторием connectivity ? — Vort ( обс. ) 15:04, 31 августа 2020 (UTC) [ ]

Тупиковые статьи

Здравствуйте. А кто сможет реанимировать актуализацию информации в категории тупиковые статьи и статистику связности ? Oleg3280 ( обс. ) 14:58, 29 августа 2020 (UTC) [ ]

Здравствуйте. Если восстановится работа инструментов, упомянутых в предыдущей теме, то все эти вопросы решатся автоматически. — ( обс. ) 15:56, 29 августа 2020 (UTC) [ ]
Спасибо. Oleg3280 ( обс. ) 15:59, 29 августа 2020 (UTC) [ ]

Фактически изолированные статьи

Обнаружил, что ряд плохо связанных статей не отслеживается:

  1. Статья-сирота Чары гипотезы Пуанкаре ни в одной из версий не содержит пометки об изолированности. Единственная ссылка на неё шла из несвободного изображения, которое в ней же используется. Это касается вообще изображений из Википедии, которые "связывают" статьи, или проcто здесь бот не сработал? всё в порядке, не увидел
  2. Статьи, которые связаны ссылками через навигационные и прочие шаблоны, в том числе примечания, подписи на картах, схемах, под изображениями и т.д. Те же навигационные шаблоны и шаблоны вроде {{ Wikidata/Ancestors }} в мобильной версии не видны (и в десктопе часто свёрнуты) и по факту статья может быть изолирована у львиной доли читателей.

( обс. ) 16:44, 29 августа 2022 (UTC) [ ]

С другой стороны навигационный шаблон — это ведь как ссылки из какого-нибудь раздела вроде «см. также» или чего-нибудь подобного. То есть такие статьи действительно не такие уж изолированные) Maryanna Nesina (mar) ( обс. ) 17:12, 29 августа 2022 (UTC) [ ]
  • При этом раздел См.также виден в мобильной версии, которой пользуются более половины читателей. То есть на ru.wikipedia.org статья связана шаблоном, а на ru.m.wikipedia.org может ещё нет. ( обс. ) 17:23, 29 августа 2022 (UTC) [ ]
  • К тому же, если шаблон свёрнутый или не свёрнутый, но очень громоздкий, то (с точки зрения перехода из статьи в статью) его ценность ниже даже в десктопе. ( обс. ) 17:33, 29 августа 2022 (UTC) [ ]

Статистика

сверх 26.000 - было к 16.06.2022

около 25.000 - около 16.08.2022

менее 25.000 - 02.09.2022 Лиманцев ( обс. ) 15:52, 2 сентября 2022 (UTC) [ ]

пересечения

Участники Великой Отечественной войны — 714 на 17.02.2024, 719 на 19.11.2023, 723 на 28.07.2023, 765 на 20.12.2022, 741 на 21.02.2023, 733 на 03.04.2023

Участники Олимпийских игр‎ — 431 на 17.02.2024, 385 на 19.11.2023, 347 на 28.07.2023, 240 на 20.12.2022, 271 на 21.02.2023, 281 на 03.04.2023

Русские писатели 1800—1917, очищена 28.07.2023. Ранее 13 на 21.02.2023 и на 03.04.2023

Лауреаты (есть и нобелиаты, например Саагян, Дорк ) — 560 на 17.02.2024, 536 на 19.11.2023, 544 на 28.07.2023, 546 на 20.12.2022, 570 на 21.02.2023, 565 на 03.04.2023

Химические вещества 305 на 17.02.2024, 322 на 19.11.2023, 327 на 28.07.2023, 477 на 20.12.2022, 396 на 21.02.2023, 359 на 03.04.2023

Футболисты 982 на 17.02.2024, 907 на 19.11.2023, 846 на 28.07.2023, 843 на 03.04.2023, 801 на 21.02.2023, 743 на 20.12.2022 Лиманцев ( обс. ) 18:47, 20 декабря 2022 (UTC) [ ]

статистика

Старейшие изоляты - 2010 года Лиманцев ( обс. ) 14:23, 23 декабря 2022 (UTC) [ ]

Почему не пришёл бот

In Light-Years There's No Hurry , есть ссылки только из редиректа и файла ( обс. ) 13:30, 15 августа 2023 (UTC) [ ]

Источник —

Same as Связность