Wikipédia:Esplanada/geral/Correcção semi-automática (AWB) de wikilinks para redirec.s (28fev2010)

Origem: Wikipédia, a enciclopédia livre.

Correcção semi-automática (AWB) de wikilinks para redirec.s (28fev2010)

Há pouco um bot modificou o wikilink de uma das minhas edições, substituindo [[Ayuntamiento]] por [[Câmara municipal (Portugal)|Ayuntamiento]]. Na esmagadora maioria dos casos isso só traria vantagens, tanto por ser mais explícito, como por aliviar a carga dos servidores. Mas dá-se o caso de que eu tenho especial cuidado em evitar wikilinks para páginas redireccionadas e se o fiz nesse caso foi porque no dia em que existir o artigo "Ayuntamiento" o link ficaria a apontar para o sítio correto, enquanto que como está agora fica a apontar para um sítio que já nada terá a ver com Ayuntamiento.

Acho que a tarefa de substituir links para páginas redireccionadas tem os seus méritos, mas não deveria haver uma forma de instruir os bots para não redireccionarem certos links?
--Stegop (discussão) 15h25min de 28 de fevereiro de 2010 (UTC)[responder]

Detesto, mas detesto mesmo, nutro um verdadeiro ódio de estimação, abomino, etc. esse péssimo hábito de fazer redirects indevidos para verbetes que estão vagamente relacionados, na sanha de azular tudo o que está a vermelho. Ou, ainda pior, esses casos em que o link errado fica disfarçado na própria IL, que aí nem acertando o redirect se a coisa fica correcta. Esse maldito hábito deriva fundamentalmente das EADs, devido a uma qualquer tara colectiva anti-link vermelho, que devia ser erradicada deste projecto. Quando uma LI é alterada como essa foi, o único remédio é reverter e avisar quem o fez para que não volte a fazê-lo. Do mesmo modo, aparecendo redirects criados em LIs que ainda não tenham artigo e que apontam para artigos gerais (tipo "Lei das Sesmarias" a apontar para Direito, já vi coisas assim), esses redirects devem ser sumariamente mandados para ER, e a ligação deve ser mantida a vermelho. --- Darwin Alô? 16h03min de 28 de fevereiro de 2010 (UTC)[responder]
Mandei o Ayuntamiento para ER, pois aí está um bom exemplo de um redirect estúpido: Aponta para uma página que nem define a coisa, apenas a refere numa lista de exemplos a título comparativo. Mesma coisa que se tivesse a apontar para Prefeitura. Pode até ser argumentado que o facto do artigo Ayuntamiento ainda não existir deve-se possivelmente à existência desse redirect idiota, que até agora camuflava a necessidade desse artigo. --- Darwin Alô? 16h16min de 28 de fevereiro de 2010 (UTC)[responder]
Agradeço-lhe a resposta, mas quando coloquei a questão não estava a pensar no problema de redirec.s impróprios. Por sinal, não vejo que seja assim tão errado que Ayuntamiento aponte para Câmara Municipal enquanto não houver artigo próprio. Como me faz muita espécie os artigos mínimos, acho preferível os redireccionamentos para artigos genéricos, embora o Ayuntamiento não seja o melhor exemplo. Deixe-me dar um exemplo: ainda há pouco expandi Serra de Gredos e ponderei incluir uma secção com a tradução de es:Circo de Gredos, o que fazia todo o sentido pois nem o artigo da serra nem o do circo teem assim tanto texto e quem fosse lesse o artigo da serra ficava a saber do circo. Se o tivesse feito, não faria sentido criar um redir de "Circo de Gredos" para Serra de Gredos?
De qualquer forma, de pouco nos adianta se os redirec.s estão ou não certos, o que é facto é que haverá casos ainda mais gritantes que o de Ayuntamiento e, por outro lado, mesmo aqueles que são menos questionáveis hoje, podem vir a ser artigos separados no futuro. Eu deparo-me com casos desses todos os dias e se, bem que em mais de 90% dos casos tenha o cuidado de apontar os IL para o artigo e não para o redir., já me interroguei muitas vezes se isso é o mais acertado.
--Stegop (discussão) 18h26min de 28 de fevereiro de 2010 (UTC)[responder]
Esqueça... Acho que acabei de encontrar a solução e ela é tipo ovo de Colombo: basta que seja uma predef a criar o IL. Se calhar até já existe, e se não existir é trivial de fazer. --Stegop (discussão) 18h28min de 28 de fevereiro de 2010 (UTC)[responder]
  • Não percebi a última parte do que escreveu, mas em relação ao caso que mostrou da Serra de Gredos, isso sim, faria todo o sentido. Não há problema em fazer redirect para um artigo mais geral, desde que esse artigo contenha a definição do redirect, e em local bem visível, de preferência. --- Darwin Alô? 18h33min de 28 de fevereiro de 2010 (UTC)[responder]
Suponho que há uma forma simples de evitar que os IL sejam mexidos pelos bots e AWB: é criá-los com uma predef que contenha [[{{{1}}}]]. Entretanto, veja o que acabei de (re)descobrir: [1] --Stegop (discussão) 18h43min de 28 de fevereiro de 2010 (UTC)[responder]
Muito boa essa secção da documentação da Wiki en, demonstra bem o trabalho inglório, e até prejudicial ao projecto, que fazem todos quantos afanosamente substituem redirects ou, pior, disfarçam links vermelhos com pipelinks errados, como aparece muito (pelo menos aparecia) nos artigos destacados. Em relação a colocar links dentro de predefs para não serem apanhados pelso bots, sinceramente, creio que esse não é o caminho, e possivelmente traria mais problemas que benefícios (quebra a padronização de LIs). Se um bot está a fazer mal alguma coisa, como esse estava, o seu dono deve ser avisado, e não arranjar um esquema para contornar o que o bot faz mal. --- Darwin Alô? 18h59min de 28 de fevereiro de 2010 (UTC)[responder]
Oh amigo... além de ser praticamente impossível contactar os vários os bots e operadores de AWB que fazem isso todos os dias, não me atreveria a tal nem que achasse que eles deviam parar. Apesar de me parecer que estão a ser mais papista que o papa, estão bem intencionados e, em 99% dos casos acho que, a bem da clareza, é bom que os IL sejam "desambiguados". É certo que o "meu" esquema quebra a padronização, mas qq. forma de marca para excluir atividade de bots vai ter esse problema. --Stegop (discussão) 19h31min de 28 de fevereiro de 2010 (UTC)[responder]
Eu nunca vi nenhum bot a substituir redirects em LIs por sistema, se visse avisaria imediatamente para que parasse, ou até pedia o bloqueio ao bot, se o operador não estivesse perto. Pode até estar bem intencionado, mas é algo que nunca pode ser feito de forma automática. Temos muitos bots aqui, mas geralmente fazem tarefas muito específicas, já com anos de garantia, nada semelhante ao que descreveste. --- Darwin Alô? 19h41min de 28 de fevereiro de 2010 (UTC)[responder]

Sou a favor de arrumar os redirects assim em páginas de dsambiguação e em predefinições, usando bot mesmo. Pelo menos nesses 2 tipos de páginas não há motivo para ter redirect, e a maioria das correções será válida. As mudanças erradas que forem feitas serão todas por erro de redirect indevido (se está em predef é pq é importante merece artigo próprio e não deveria ser redirect para artigo maior pois dificulta sua criação). O caso citado só precisa de um ajuste, para não arrumar em documentação de predefinição. Rjclaudio msg 20h57min de 28 de fevereiro de 2010 (UTC)[responder]

Rjclaudio, essas mudanças, nas quais não consigo ver qualquer vantagem que mereça sequer pensar nela, são potencialmente prejudiciais ao projecto. As desambiguações em especial nunca deveriam ser mexidas dessa forma. Imagina que tinha feito um artigo principal onde meto todas as pequenas Achadas da Ilha da Madeira, e crio redirects para lá para cada uma. Essa alteração absurda que se propõem fazer iria estragar a desambiguação, não só porque não mostraria correctamente os afluentes do artigo principal, como porque se futuramente fossem criados artigos individuais a desambiguação não funcionaria. As alterações em predefinições têm o mesmo problema. A percentagem de falsos positivos é demasiado alta para que uma coisa dessas possa ser feita por bot. Pior ainda, isso nem erro é, é pura perda de tempo, além de danificar o projecto. --- Darwin Alô? 21h12min de 28 de fevereiro de 2010 (UTC)[responder]
Parei o Bot. As edições devem-se a um pedido da coordenação robótica. As edições foram efectuadas usando um script py padrão. A questão embora possa trazer alguns dissabores não me parece fora do comum, afinal é para onde são direccionados os leitores ao seleccionar essa informação, e com uma edição o problema é resolvido quando se criarem os artigos mais apropriados. Agora a manutenção de tantos redirects trás também dissabores. A wikipédia em português é uma das que mais redireccionamentos têm, em parte pelo hábito que se tem de colocar o link mais fácil, e por exemplo, caso se tente criar uma versão em cd ou dvd, serão necessárias muitas mais páginas, somente para uma pequena porção de informação. Não são somente uma ou duas as predefinições que contêm redirects, são quase todas, e grande parte delas unicamente porque se colocou o link mais fácil. Da minha parte, havendo quem discorde, estas edições encontram-se suspensas. Se entretanto decidirem que devem ser retomadas, basta avisar. Alchimista Fala comigo! 21h14min de 28 de fevereiro de 2010 (UTC)[responder]
A colocação do link "mais fácil" tem a vantagem enorme de se conseguir avaliar o tipo de utilização do tema do artigo noutros artigos, principalmente se esse artigo albergar três ou quatro artigos mais pequenos. Inclusivamente, já estive a fazer o oposto do que vocês estavam a fazer, precisamente a alterar pipelinks para redirects apropriados, por essa mesma razão, e muito me custa ver que andam bots aí a destruir esse trabalho. Além disso, permite detectar erros de escrita, que com a "correcção" do redirect ficam ocultados. Além disso, entulha o artigo com pipelinks extravagantes sem qualquer necessidade. Tantas desvantagens para "poupar trabalho carga aos servidores"? Só os edits que essas benditas "correcções" acarretam devem ser largamente superiores em peso a qualquer que seja a carga de um redirect, além de entulharem o histórico. As desvantagens são mais que muitas para que se possa pensar em fazer isso por sistema. Da minha parte, se vir isso acontecer num artigo, essas substituições, há boa probabilidade de considerar isso um erro e reverter para o formato original. --- Darwin Alô? 21h21min de 28 de fevereiro de 2010 (UTC)[responder]
  • Se somso uma das wikis que tem mais redirects (e nunca ouvi dizer que isso fosse problema, pelo contrário), isso deve-se certamente ao uso e abuso deste tipo de redirect: Conde de proença-a-velha que um bot andou a criar há mais tempo. Há uns meses mandei umas boas dezenas dessas inutilidades para ER, até que me disseram para parar. Isso sim, é entulho. Agora, redirects com formas válidas de nomear um artigo devem existir sim, e no maior número possível. É assim que os leitores chegam onde querem. Se querem meter o bot a trabalhar, mandem esses milhares de redirects iguais ao exemplo citado para ER, isso sim, seria uma boa tarefa para um bot. --- Darwin Alô? 21h32min de 28 de fevereiro de 2010 (UTC)[responder]
Na primeira parte concordo, realmente é uma forma de avaliar o tema, mas não estamos aqui para avaliar temas. È útil, e tem uma boa finalidade, mas não nos podemos prender por isso, teremos de pesar as vantagens e desvantagens. Não percebi foi a parte de permitir detectar erros de escrita, se tem erros de escrita nas predefinições, devem ser corridos. Na questão dos pipelines, não vejo como uma predefinição inclui pipelines nos artigos, a não ser que se use o subst. E não é uma questão de servidores, eu sinceramente não vejo onde está o efeito prejudicial e irreversível, tendo em conta que quando o artigo for criado, não será necessário pipeline ou redirect, simplesmente uma ligação directa. Agora pensem pro exemplo que pretendem fazer uma versão da wikipédia numa pen, ou dvd, já viram que teriam imensas páginas para colocar, somente com redirects? E reafirmo uma vez mais, a nossa versão é das que mais páginas de redireccionamento tÊm, de todas as grandes wikipédias. Alchimista Fala comigo! 21h35min de 28 de fevereiro de 2010 (UTC)[responder]
  • Quando coloquei este assunto aqui, nem sequer me passou pela cabeça propor parar com esse afã de "pipar" ILs, apenas alertar para que deve haver uma forma de assinalar que o editor não deseja que isso aconteça em determinados ILs. No decurso da discussão apercebi-me que afinal o problema era mais vasto e, francamente, quando vi o artigo da en a desaconselhar, fiquei realmente perplexo por não perceber a razão no empenho. Quanto a poder editar quando a página for criada, é verdade, mas quem me diz que eu me vou aperceber ou se ainda vou estar por cá? O argumento não faz sentido! E não me agrada nada ouvir tão frequentemente do tipo "a maioria", "nunca ouvi falar de tal coisa", etc. Usar e aceitar argumentos desses é avançar para a estagnação. Não percebo quais os problema que acarretam os redir.s para a produção de um CD ou DVD que não possam ser resolvidos com incluir o código de correção de redir.s na aplicação que produz o DVD. Entretanto, no que toca às minhas edições, o bot pode continuar a correr pois como já disse, em regra uso pipes e o Ayuntamiento foi o primeiro caso em que me dei conta que apontar para redir era preferível. --Stegop (discussão) 21h47min de 28 de fevereiro de 2010 (UTC)[responder]
  • Citação: Alchimista escreveu: «quando o artigo for criado, não será necessário pipeline ou redirect, simplesmente uma ligação directa» - Pelo contrário, meu caro. Se eu crio um artigo que alberga 10 subtemas, que estão ligados a ele por meio de redirects, a substituição pelo piped link destrói totalmente essa organização, como expliquei acima, e se mais tarde os subtemas forem separados, obriga-me a correr os 3 milhões de afluentes do artigo principal à pata para ver quais é que precisam de ser trocados pelo que está no piped link, graças a essa maravilha de bot. Isso, francamente, é um desrespeito para com quem trabalha.
  • Citação: Alchimista escreveu: «E reafirmo uma vez mais, a nossa versão é das que mais páginas de redireccionamento tÊm, de todas as grandes wikipédias.» - E eu reafirmo novamente que 1) Nunca ouvi dizer que isso fosse problema. Pelo contrário, se bem me lembro, foi quase a única classificação positiva que recebemos no estudo de qualidade sobre os vários projectos da Wikipedia. 2) Infelizmente, no nosso caso, o grande número de redirects não se devem a redirects úteis, mas sim a redirects em minúsculas criados por um bot há usn anos, que devem contar-se nas centenas de milhar em número, e que além de serem inúteis atravancam a caixa de pesquisa e dificultam que se chegue a onde se quer. Se querem dar um bom trabalho aos bots, comecem a mandar esse lixo para ER. --- Darwin Alô? 22h16min de 28 de fevereiro de 2010 (UTC)[responder]
Não entendam isto com um ataque pessoal, pois não é essa a intenção, principalmente porque o mais provável é que a situação também não agrade aos intervenientes na discussão, mas não resisto a mandar uma boca: dado o hábito tão enraizado por cá de produzir artigos de uma frase e a resistência que há sempre que alguém propõe como alternativa a criação de listas, ignorando completamente o que é dito algures nas páginas que descrevem o "ciclo de vida normal de um artigo", percebo que muito pouca gente lhe tenham ocorrido os exemplos de que o Darwin fala. Lembro-me bem da minha estupefação quando uma das minhas primeiras ER's ou ESR, sobre um artigo "Bandeira de X" que constava da imagem da bandeira e da frase do tipo "a bandeira de x representa x", foi removida porque "tinha potencial para crescer" e "isto é caso para {{mínimo}}", não para ER. Não está em causa que não era caso de ER, mas é uma boa e triste caricatura do que se passa. O Darwin provavelmente está a ver mal as coisas, porque na esmagadora parte dos casos é mais provável que existam 20 artigos de uma frase para os tais 10 temas do que, se calhar, o artigo principal. E esses 20 (ou serão 30?) todos juntos teem menos informação útil do que o artigo principal correspondente na en tem numa das secções. Desculpem o sarcasmo e a a mudança de assunto. --Stegop (discussão) 23h13min de 28 de fevereiro de 2010 (UTC)[responder]
  • Eu não acho que esteja a ver mal as coisas, e os casos não são tão poucos como isso, nem nada que se pareça.
  1. Tome-se, por exemplo, o caso dos Pseudo-redirects. Todas as correcções de designações incorrectas em desambiguações e predefs deixam de poder ser feitas de modo automático seguindo os afluentes, nem são facilmente detectáveis (e Deus nos livre de levarem essa mania de "corrigir" redirects para o domínio Principal!!).
  2. Outro exemplo: Um termo que mudou oficialmente de nome (Alto Volta -> Burkina Faso, p ex.). Antes podiam ser vistas todas as predefs e desambiguações que usavam um termo ou outro pelos afluentes do principal, e acertadas quando necessário, o que agora passa a ser impossível graças às benditas "correcções".
  3. Outro caso: Artigos que têm dupla designação, há muitas vezes interesse em se saber quando é usada uma forma ou outra.
  4. Redirects que apontam para listas: Ao contrário da impressão do Stegop, eu sei ser facto aqui no projecto (provavelmente por ter mais experiência) que eles são mais que muitos, até porque isso faz parte de diversos Critérios de Notoriedade e outras recomendações. Só em filmes, séries, personagens, Narutos, etc há um milhão dessas coisas. Tudo arruinado no trabalho do bot.
  5. Outro: Artigos sobre eventos futuros, que agora passam a ter Artigo sobre evento futuro no piped link.
  6. Como já disse acima, houve mesmo casos em que eu estive a seguir os afluentes de um tema retirando o piped link e colocando redirects para facilitar a sua organização e expansão futura, tudo destruído pelas "correcções".
  • Eu penso que a comunidade não se está a aperceber do grau de destruição que as alterações previstas por esse bot causam no projecto, mesmo que se limite só a desambiguações e predefs. Já é muito mau o que foi feito até agora, que terá de ser revisto. Peço, muito sinceramente, que abandonem esta ideia peregrina, e que usem os bots em algo que seja útil para o projecto, em vez de o danificarem. --- Darwin Alô? 09h11min de 1 de março de 2010 (UTC)[responder]
Estava a ironizar com um assunto sério. Desculpem-me... --Stegop (discussão) 22h38min de 1 de março de 2010 (UTC)[responder]
Eheheh Stegop, eu percebi, mas não fosse alguém pensar que era mesmo verdade... Dada a pouca atenção e interesse do resto da comunidade nesta discussão, e o que já foi escrito acima defendendo a substituição de redirects por piped links, já acredito em tudo. --- Darwin Alô? 22h44min de 1 de março de 2010 (UTC)[responder]