Saltar para o conteúdo

Wikipédia:Esplanada/geral/Queda no número de edições (27nov2013)

Origem: Wikipédia, a enciclopédia livre.

Queda no número de edições (27nov2013)

Estava olhando os gráficos da Wikipédia lusófona e vi algo muito preocupante, o número de edições no domínio principal e Anexo (primeiro gráfico vermelho nessa página) em outubro foi o menor desde março de 2006! Se olharmos os gráficos amarelos nessa página vamos ver também que o número de novatos (2º gráfico), o número de usuários que editaram mais de 5 vezes no mês (3º gráfico) e mais de 100 vezes no mês (4º gráfico) também caiu nos últimos meses a patamares de 2006 e 2007.

Para tentar descobrir o motivo da queda fiz um gráfico mais detalhado, pegando apenas 2013, removendo edições de robôs, contando as edições por dia e separando as edições em edições de IPs, usuários registrados com mais de 1000 edições (considerei mais de 1000 edições nos domínios principal e Anexo no momento da coleta de dados, 27/11/2013) e registrados com até 1000 edições:

Como podem ver no gráfico, existe um aumento repentino nas edições de IPs em abril e uma redução no final de julho, o que coincide com a desativação e reativação do CAPTCHA, o que já era de se esperar, pois o CAPTCHA desincentiva a edição, porém isso não explica a redução nos últimos meses, sempre tivemos o CAPTCHA ativado até abril, a reativação só fez as edições de IPs retornarem ao que eram antes. A explicação da queda parece estar na linha azul, edições de usuários mais experientes. Não é uma queda brusca que pode ser atribuída a um evento específico, então não sei o que pode ter causado tal queda, um desânimo dos veteranos talvez? Precisamos saber o que causou essa queda e tentar fazer algo para reverter esse quadro. Ideias sobre o motivo da queda? Danilo.mac(discussão) 19h18min de 27 de novembro de 2013 (UTC)[responder]

Normal, já que agora só querem artigos novos prontos, na variante de quem grita mais, e por editores registrados. Se conhecesse o projeto como está hoje, jamais teria me tornado um editor.--Arthemius x (discussão) 19h29min de 27 de novembro de 2013 (UTC)[responder]

PS: Olhem só, o Kaktus Kid, um dos editores antigos que mais criam e criaram artigos, não é mais autorrevisor porque cria artigos "sem fontes". Perguntem a ele se isso o deixou animado a aumentar as edições.--Arthemius x (discussão) 19h48min de 27 de novembro de 2013 (UTC)[responder]

Só para constar, agora que o bugzilla:46212 foi corrigido também estão disponíveis as estatísticas sobre reversões deste ano, mencionadas no bugzilla:41745#c44. Helder.wiki (discussão) 19h39min de 27 de novembro de 2013 (UTC)[responder]
Não sei se está relacionado (no sentido de terem alterado parâmetros gerais de cálculos), mas ao que parece houve uma recente mudança no cálculo de usuários ativos por parte da WMF. Os números subiram assombrosamente na lista no Meta. Sturm (discussão) 19h47min de 27 de novembro de 2013 (UTC)[responder]
Fora de contexto: interessante o indicador de "depth" para a ptwiki!Au pair com outras bem maiores e mostra que o crescimento de algumas foi puramente robotizado (cebuano? waray-waray?). José Luiz disc 19h55min de 27 de novembro de 2013 (UTC)[responder]
Teve uma subida, mas nada de assombroso. Lijealso (discussão) 20h00min de 27 de novembro de 2013 (UTC)[responder]

@Danilo, em linha com o que disse o Sturm, ter mais de mil edições não significa que são "ativos" e muito menos "experientes". Você consegue cruzar os dados com a lista dos "50 recently active wikipedians, excl. bots, ordered by number of contributions" que está aqui e daí fazer o breakdown? José Luiz disc 19h53min de 27 de novembro de 2013 (UTC)[responder]

O Rodrigo Padula? Qual o número do bug, Jo Lorib? Helder.wiki (discussão) 20h31min de 27 de novembro de 2013 (UTC)[responder]
Falei agora com o Padula, o bug foi nos page views, não tem relação com o registros de edições. Eu gerei o gráfico direto no banco de dados, fazendo uma busca nos registros das edições, se tivesse algum erro no banco de dados vocês veriam edições sumirem dos históricos. o que mudaram foi o modo como fazem os cálculos de algumas estatísticas, não os registros no banco de dados. Zé, vou tentar fazer a pesquisa que sugeriu, mas já adianto que usuários inativos não aumentam os números em nenhuma linha, então provavelmente vai dar no mesmo. Danilo.mac(discussão) 20h46min de 27 de novembro de 2013 (UTC)[responder]
O HAndrade (WMF) é o analista de dados contratado para apoiar o programa catalisador, creio que ele pode dar uma força pra vocês nessa questão. Rodrigo Padula (discussão) 20h49min de 27 de novembro de 2013 (UTC)[responder]
  • É preciso levar em consideração que a quantidade de filtros avisando e desautorizando aumentou além da eficiência dos outros. Prometo fazer uma estimativa apurada mas chuto que o efeito pode ser por volta de 5%. Metade de vandalismos e metade ee reversões que deixaram de ser feitas.OTAVIO1981 (discussão) 22h23min de 27 de novembro de 2013 (UTC)[responder]

José Luiz, fiz o gráfico que sugeriu, o que aconteceu foi que mais da metade das edições que estavam na linha azul foi para a linha verde, e a queda que estava só na linha azul ficou diluída entre as duas linhas. Falei com o Henrique (por e-mail, a internet dele está ruim), ele disse que a query está aparentemente correta e sugeriu quebrar a query, fiz então este outro gráfico, separando a linha dos usuários com mais de mil edições em duas. O que o Otávio disse faz sentido, se os filtros estiverem impedindo mais vandalismos, tanto as edições de vandalismo como edições de correções de vandalismo deixam de ser feitas, tomara que seja isso mesmo. Vou tentar também fazer outras pesquisas para ver se descubro mais alguma coisa. Danilo.mac(discussão) 03h03min de 28 de novembro de 2013 (UTC)[responder]

Faz o gráfico de edições dos usuários que fazem mais reversões. Ou dos reversores em geral. Pra ver se aparece essa diferença do filtro. Rjclaudio msg 12h07min de 28 de novembro de 2013 (UTC)[responder]
Achei excelente o que este gráfico mostra, e que vai contra as previsões pessimistas. O que ele mostra claramente é que o número de edições por IPs é o que tem ditado o número de edições por veteranos, e quanto mais edições por IP, mais tempo e energia os veteranos gastam revertendo IPs. Se o número de edições por IPs fosse zerado, estes veteranos poderiam dedicar seu tempo e energia a criar e melhorar artigos. Albmont (discussão) 16h37min de 28 de novembro de 2013 (UTC)[responder]
Caso o que o Albmont diz seja verdade, deve ser "fácil" de comprovar. Basta separar as edições do velhotes em reversões e não-reversões e verificar que o número de reversões diminuiu mas o número de edições em que adicionam conteúdo aumentou. GoEThe (discussão) 16h41min de 28 de novembro de 2013 (UTC)[responder]
Não foi isto que eu disse (ou talvez tenha sido, não me expressei bem). O que o gráfico mostra, claramente, é que desde Abril o número de edições por IP "causa" o número de edições por veteranos. Isso pode ser testado, se chama teste de causalidade de Granger, qualquer software econométrico pode testar a hipótese. O CAPTCHA dava um alívio aos veteranos, o que pode ser visto pelas edições no início do ano, em que existe um gap pronunciado de edições por veteranos que não são reversões de IP. O que me deixou otimista foi exatamente a queda nas edições por IP, o que pode levar, no futuro, a que veteranos voltem a se animar a editar em vez deste desânimo desde Abril em que quase tudo que os veteranos fizeram foi reverter IPs. Albmont (discussão) 16h57min de 28 de novembro de 2013 (UTC)[responder]
Eu confesso que tenho acompanhado os dados com preocupação. Eu não acho normal que hoje haja menos colaborações. Ter menos verbetes novos poderia até ser uma tendência "natural" (embora mesmo isso não necessariamente se confirme em outras wikipedias com muito mais artigos que a nossa). Mas a queda de edições é geral, e isso é uma tendência que o natural seria "quanto mais conteúdo, mais coisas a se editar", pois há que se atualizá-las, melhorá-las etc. Não há qualquer evidência de que a queda de edição no geral reflita maturidade do projeto. Pensando no médio prazo, contar com mais e novos colaboradores, inclusive para futuramente cumprirem tarefas administrativas que hoje sobrecarregam usuários experientes, é muito importante para a sustentabilidade do projeto, não? Além do princípio de abertura da Wikipédia, vejo como fundamental para o crescimento a entrada de novos colaboradores e, como um preço temporário, a sua inexperiência, que só vai ser revertida se melhorarmos as atividades de recepção, formação e acompanhamento dos novos usuários. Sabemos que isso se torna mais uma tarefa que demanda tempo de voluntários experientes, mas queremos e podemos apoiar iniciativas neste sentido, das mais diversas formas. Ideias são bem-vindas (e vou anunciar em outra esplanada, mas estamos com uma consulta aberta para o projeto de microgrants.--Oona Castro (discussão) 17h09min de 28 de novembro de 2013 (UTC)[responder]
  • Fiz alguns levantamentos preliminares das contribuições dos filtros que resumo na tabela abaixo:
2012 2013
ago set out ago set out
C A I 9235 8679 8660 7979 10580 10970
T E T I 14499 13834 13867 15229 16172 16717
% 63,7% 62,7% 62,5% 52,4% 65,4% 65,6%

Entendendo a tabela: T E T I significa "Tentativa Editor no Título em dado Instante", isto é, um editor tenta editar determinado artigo em um minuto. Se ele disparar 10 filtros com esta tentativa vai contar como 1. Se ele tentar no mesmo instante (dia, hora, min) novamente, vai acumular como 1 mesmo tendo sido na verdade duas. Isto é ruim nos casos em que o filtro avisa e etiqueta mas até o momento não consegui resolver o problema. De todo caso, acho que são poucos casos em que a tentativa é no mesmo minuto.

C A I significa "Com Algum Impedimento", isto é, se o T E T I teve 10 disparos de filtro e pelo menos 1 destes foi um aviso ou desautorização consideramos que a edição foi impedida e este número é o total.

Interpretando a tabela: Por um momento, vamos deixar agosto de fora pois, ou os dados de 2012 estão altos ou os de 2013 estão baixos (há uma explicação adiante) e nos ater aos dados de setembro e outubro. A quantidade de TETI com CAI aumentou em média 2,9% em relação ao ano passado. Se todas estas TETI eram vandalismos, corresponderá a 5,9% edições a menos em 2013. Conforme expliquei acima, cada vandalimos que passa tem o custo de 1 edição para remover.

A questão de agosto: minha suspeita é de que o mês de agosto deste ano tenha sido impactado pela ativação do 113 sem ação nenhuma pois isto dilui a relação CAI/TETI (%). Não vi nada de suspeito nos dados de 2013 e 2012 além disso mas vou continuar investigando. O filtro foi desativado em 4 de set e reativado no fim de outubro no modo avisar o que não atrapalha a relação CAI/TETI. Espero que com os dados de novembro seja possível ter mais alguma luz nesta questão da discrepância do dado apresentado.

No próximo dia 6 o Rjclaudio, HAndrade (WMF) e eu vamos nos reunir para um encontro técnico sobre filtros onde pretendemos discutir não só estas questões do impacto da ferramenta quanto formas de melhorá-la sem prejudicar edições de boa fé. Sds, OTAVIO1981 (discussão) 17h58min de 28 de novembro de 2013 (UTC)[responder]

Fiz esta pesquisa sobre usuários que mais reduziram o número de edições ao longo de 2013. E fiz também esta pesquisa com a query que o Henrique me passou sobre reversões de edições de IPs, parece que de fato as reversões diminuíram em 2013. Também fiz esta, que é quase igual a query do gráfico, apenas para comparem os números. Danilo.mac(discussão) 19h19min de 28 de novembro de 2013 (UTC)[responder]
Tem como fazer uma análise das edições úteis por usuários novos e por usuários veteranos? Ou seja, desprezando as reversões de vandalismos de IP e vendo se a queda do número de edições desde Abril não foi porque as pessoas desanimaram nesta época progressivamente ao longo dos meses, mas porque desanimaram quando o CAPTCHA acabou em Abril? Minha hipótese: houve uma quebra estrutural em Abril/2013, antes os editores veteranos tinham muito a contribuir tanto na parte criativa quanto na parte defensiva mas, quando acabou o CAPTCHA, a grande maioria desistiu da parte criativa e se tornou meramente um reversor de IPs, e, quando os IPs passaram a vandalizar menos (não sei porque isto teria acontecido) estes editores, por inércia, continuaram desanimados, sem perceber que podiam voltar a criar. Albmont (discussão) 19h57min de 28 de novembro de 2013 (UTC)[responder]
Albmont, já todos sabemos que é contra a permissão dos IPs editarem. --João Carvalho deixar mensagem 20h13min de 28 de novembro de 2013 (UTC)[responder]
Sim, e daí? Agora pode ser possível demonstrar matematicamente que a permissão dos IPs editarem causa um dano enorme à Wikipédia, ao desanimar editores. Albmont (discussão) 20h58min de 28 de novembro de 2013 (UTC)[responder]
Achei a proposta do Albmint interessante mas incentivar os editores a contribuir mais seja criando ou revertendo é a galinha dos ovos de ouro de todo projeto wikimedia. OTAVIO1981 (discussão) 21h14min de 28 de novembro de 2013 (UTC)[responder]
Fiz a pesquisa proposta. Ironicamente ela está mostrando o contrário da teoria do Albmont, está mostrando que as edições de registrados que não são reversão caíram a partir de agosto, quando o CAPTCHA foi reativado. Eu também já tinha essa impressão ao ver o gráfico, a linha azul parece ter uma queda maior a partir do meio de julho não de abril, e olhando os gráficos amarelos na página de gráficos parece também haver uma queda mais acentuada a partir de agosto. O CAPTHA foi reativado em 29 de julho e as discussões sobre reforma da verificabilidade também foram mais ou menos nesse período, uma dessas duas coisas deve ter relação com a queda. Essa última pesquisa também mostra dados interessantes em outros campos como as reversões feitas por não robôs, parece haver uma sazonalidade, diminuindo o número de reversões nos períodos de férias escolares. Danilo.mac(discussão) 00h54min de 29 de novembro de 2013 (UTC)[responder]
Para mim é evidente que quando se passa menos tempo a reverter do que a editar de facto, o número de edições desce drasticamente mesmo que se dispenda mais tempo a trabalhar para o projeto. No meu caso, que não deverá ser muito diferente de muitos dos que não se dedicam exclusivamente ao anti-vandalismo, se houver um dia em que não faço reversões, o meu número de edições é infinitamente menor apesar de ter passado o mesmo tempo a trabalhar em artigos. Muito provavelmente isso é patente se comparem as minhas contribuições como Stego (que uso mais para anti-vandalismo e manutenção) ou como Stegop (que uso mais para edições mais "comuns"). Como dizia o meu saudoso prof de Fundamentos de Telecomunicações, estatística é muito bonita, mas é muito complicado, quando não enganador, confiar em certas conclusões que dela se podem inferir. E, indo ao sabor da corrente dos palpites, a hipótese do Albmont provavelmente está certa, quando diz que o trabalho de reversão, além do tempo que ocupa tem como efeito colateral que quem o faça perder o alento para fazer coisas "mais construtivas" depois de passar muito tempo a limpar...[piiii] dos outros. E o tempo que se passa em discussões também é roubado ao resto e origina um número menor de edições do que outras tarefas.
Se é certo que o número de edições é um indicador a ter em atenção, por ser fácil de obter e muito preciso, convém não perder de vista que ele dificilmente tem assim tanta correlação com outros fatores muito mais importantes. Se eu diminuísse em 50% o tempo de volta das PN's e das páginas que vigio, por exemplo, e me dedicasse a expandir artigos o meu número de edições diminuiria facilmente uns 80% ou mais, mas o conteúdo que eu adicionaria poderia aumentar uns 30% ou 40%, senão mais. Isto visto sob o ponto de vista de nº de edições era catastrófico, apesar da realidade ser que o projeto estava a ganhar em termos de conteúdo (embora à conta de também se manter algum li[piiiii] que de outra forma seria revertido). --Stegop (discussão) 01h51min de 29 de novembro de 2013 (UTC)[responder]
Em relação a esse ponto levantado pelo Stegop, acho que é possível levantarmos também bytes adicionados, certo, HAndrade (WMF) e Danilo.mac?--Oona Castro (discussão) 04h36min de 29 de novembro de 2013 (UTC)[responder]
Sim, é possível Oona Castro. Conversei um pouco com o danilo sobre esses dados e podemos gerar visualizações para verificar a atividade de usuários entre edições e reversões, observando também o tamanho das edições e mudanças de "perfil" de contribuições de usuários. Vou começar a rascunhar isso e daqui a pouco compartilho link aqui. HAndrade (WMF) (discussão) 07h59min de 29 de novembro de 2013 (UTC)[responder]
Também pensei que, mesmo que as edições não-reversões (e acho que o Stegop não está a perceber bem que se separou as edições em duas partes) se mantivessem um pouco ao mesmo nível era possível que essas fossem melhor planeadas, mais completas e mais satisfatórias (para o próprio editor), e isso é difícil de quantificar. Agora que elas baixem não bate certo com a teoria que se reversores não reverterem que dediquem mais do seu tempo a editar, pelo menos em termos gerais. O que pode indicar é que houve alguma saída de editores durante o Verão, talvez pelo aumento do trabalho de reversão derivado da retirada do CAPTCHA ou pela degradação da discussão sobre as PEs excessivas (a Wikipédia:Votações/Reforma da Verificabilidade foi em Julho, por exemplo). GoEThe (discussão) 08h41min de 29 de novembro de 2013 (UTC)[responder]
Eu percebi muito bem, mas discordo completamente do Goethe quanto a «Agora que elas baixem não bate certo com a teoria que se reversores não reverterem que dediquem mais do seu tempo a editar, pelo menos em termos gerais». Se ele ler o que eu, o Albmont e o Zé dizem verá que é exatamente ao contrário: é de esperar que o *número* de edições baixe consideravelmente quando um editor "edita" em vez de reverter. --Stegop (discussão) 11h59min de 29 de novembro de 2013 (UTC)[responder]
Então sou eu que não estou a perceber. Se o Stegop faz mil edições por mês, 750 das quais reversões e 250 não-reversões e algo acontece para que tenha que fazer menos reversões, digamos 300 reversões, como é que isso explica que apenas faça 200 não-reversões? Não deveria fazer pelo menos 250 não-reversões ou talvez 300 não-reversões? GoEThe (discussão) 12h16min de 29 de novembro de 2013 (UTC)[responder]
Pois é, se eu entendi bem os últimos dados que o Danilo postou sugerem que os Stegops da wiki estão fazendo 200 não-reversões (menos do que anteriormente) mesmo tendo menos reversões a fazer.OTAVIO1981 (discussão) 12h30min de 29 de novembro de 2013 (UTC)[responder]
Ok, realmente percebi mal. A priori seria de esperar que as edições que não são reversões não baixassem e até diminuíssem e admito que seja provável que tenha realmente havido diminuição de *atividade* (a grandeza que realmente interessaria medir e para a qual não temos qualquer indicador, nem sequer indireto). Mas o anti-vandalismo passa apenas por reversões? Marcas de manutenção, pequenos ajustes, etc., têm muitas vezes as mesmas causas que as reversões e falseiam duplamente o tipo de análise que se está a fazer, pois diminuem simultaneamente as duas contagens. --Stegop (discussão) 15h14min de 29 de novembro de 2013 (UTC)[responder]

Pergunta de ignorante: as "reversões" feitas com os Fast Buttons são contabilizadas nestes números como reversões? É que se não são, então esse número tem muito pouco significado ou pelo menos não conta as reversões que realmente ocorrem. --Stego (discussão) 03h15min de 29 de novembro de 2013 (UTC)[responder]

Stego, os dados que o Danilo.mac apresentou consideram uma reversão a existência de duas revisões idênticas. Nesse caso, a edição mais recente é considerada uma reversão e a versão anterior a ela uma edição revertida. Sabemos que algumas vezes alguns usuários aproveitam o momento em que estão revertendo uma edição para melhorar algo no artigo, mas nesses casos a reversão não está sendo computada. Existe um debate global sobre qual a melhor forma de identificar uma reversão e essa foi a melhor apontada até agora.
Agora, minha vez de fazer uma pergunta de ignorante: quando uma reversão é feita utilizando o Fast Buttons a nova revisão fica idêntica a anterior/ HAndrade (WMF) (discussão) 07h59min de 29 de novembro de 2013 (UTC)[responder]
  • Citação: Mas a queda de edições é geral, e isso é uma tendência que o natural seria "quanto mais conteúdo, mais coisas a se editar", pois há que se atualizá-las, melhorá-las etc. Não há qualquer evidência de que a queda de edição no geral reflita maturidade do projeto. escreveu: «Ocastro». Será? A tendência que aparece aqui é bastante firme e poderosa. Apesar de não crescermos tanto em número de artigos quanto as micro-wikis robotizadas ou a enwiki (que é outro tipo de projeto - ele é "vitrine" de todas as wikis: todos querem seus artigos lá, independente da lingua), continuamos bem cotados ali e a "profundidade" cresce de forma saudável. Percebo claramente que o número de edições produtivas de usuários experientes e ativos cresce na mesma medida que diminui a quantidade de edições "de limpeza" e isso reflete na redução da quantidade de edições, pois não são tantas, mas aparece na ponta do aumento da qualidade. Eu edito "menos" hoje do que antes (há menos pra reverter), mas muito "mais" do que antes (artigos longos, destaques, categorias, templates etc.). Outra tendência natural é que finalmente estão acabando os jogadores de futebol e os artistas de novela, então há de fato "menos" pra criar para o editor pouco engajado e "mais" pra fazer, o que espanta o diletante. O domínio principal não é minha preocupação nesse projeto e sim a nossa capacidade de criarmos um arcabouço de regras que nos permita trabalhar com menos conflitos: 100% dos debates aqui se focam em 200 ou 300 artigos que se mandam pra eliminação por MÊS, quando criam-se aqui 100 por dia.... José Luiz disc 10h33min de 29 de novembro de 2013 (UTC)[responder]
Em tempo: eu traduzo diariamente artigos de editores que editavam muito no DP da enwiki anos atrás e hj, com o "esgotamento" de coisas novas pra falar (que é limitado em temas que não são do tipo ITN), passam o dia em páginas de apoio: categorias, templates, projetos, robôs, AWB.... José Luiz disc 10h38min de 29 de novembro de 2013 (UTC)[responder]
Concordo que olhar só para o número de edições não é suficiente para avaliar a "saúde" da comunidade. O gráfico de retenção de novos editores é outro componente que deveria ser analisado com cuidado.OTAVIO1981 (discussão) 11h53min de 29 de novembro de 2013 (UTC)[responder]

Estes números não permitem nenhuma aproximação à realidade e induzem a conclusões falsas. Nunca percebi porque é que não há dados para os quilobytes de conteúdo acrescentado/modificado em cada edição, em vez de apenas um número de edições vago. Eu sou capaz de criar um artigo com 40kb e depois gastar mais duas ou três edições para lhe acrescentar categorias. Há comparação possível entre ambas as edições para concluir seja o que for em termos de impacto global no projeto? Claro que não. Antero de Quintal (discussão) 12h28min de 29 de novembro de 2013 (UTC)[responder]

Fora que não conta também o tempo gasto em cada edição. Às vezes perco algumas horas só para colocar uma mísera "ref" para dar apoio a alguma frase que eu considero importante (se não fosse importante, navalhava). Albmont (discussão) 13h12min de 29 de novembro de 2013 (UTC)[responder]
Também nunca entendi essa paranoia em relação ao número de edição, tanto por parte de alguns da comunidade, quanto por parte da Wikimedia Foundation, sem levar em conta a quantidade de conteúdo inserido - muito menos a qualidade do que é inserido. Bom, pelo menos a Wikimedia Foundation tem grana para contratar gente para dedicar um bom tempo para trabalhar e pensar sobre esses assuntos e apoiar a comunidade que dedica seu tempo voluntário. :) --everton137 (discussão) 17h07min de 29 de novembro de 2013 (UTC)[responder]
  • Pois então, jbribeiro1 e demais, o que estamos dizendo não se opõe: o que eu disse é que não há evidências de que a maturidade implicaria menos edições. A referência de profundidade que usa leva justamente em consideração a frequência e continuidade de atualização das páginas (ou seja, não é porque o projeto cresce que se diminui a edição de páginas, suposto em comentário anterior ao meu). O que ele não leva em conta mesmo é o que outros aqui levantam sobre qualidade do conteúdo (principalmente acadêmica), algo que, além de requerer análise individualizada (e as ferramentas de avaliação já criadas não foram capazes de gerar esta análise), pode ser bastante subjetivo, objeto de disputas sobre visões, especialmente (mas não só) nos campos de "humanas" e "biológicas". Análises quantitativas não são ideais para avaliação de qualidade, mas impressões individuais e avaliações colaborativas também se mostram limitadas, bem como as feitas por "especialistas". No entanto, parece-me que, ainda que as análises de número de editores, número de edições, bytes inseridos, números de artigos, todos sejam individualmente dados limitados no que diz respeito ao que permitem avaliar, acho difícil negar que o conjunto deles diga algo sobre participação no projeto. Não se trata de tratarmos os dados como respostas ou indicadores de todos os problemas. Trata-se de olhar para eles e nos perguntarmos se eles indicam uma tendência. Creio que podemos criar inclusive indicadores de qualidade como porcentagens de artigos sem fontes, porcentagem de artigos com uma única seção, entre outros, que definamos por aqui, para tentar acompanhar melhorias que não necessariamente estejam atreladas a quantidade de verbetes e editores. Mas creio que a limitação dos dados não os invalidam. Sobre medição de tempo dedicado, acho que também terá limitações claras, mas podemos fazer um levantamento do que é possível fazer e avaliar se vale a pena.--Oona Castro (discussão) 00h09min de 30 de novembro de 2013 (UTC)[responder]
Concordo com a Oona, as estatísticas não trazem respostas prontas, elas nos auxiliam na avaliação do que está ou não está acontecendo com o projeto. Fiz a pesquisa dos bytes adicionados com ajuda do Henrique, colocamos bastante informação em duas tabelas, se ficar muito confuso olhem apenas as três primeiras colunas da primeira tabela. A primeira tabela é o número de edições, bytes adicionados às páginas e a média de bytes por edição, e depois repetindo essas três colunas porém incluindo as edições que foram revertidas, todos os dados se referem a edições de usuários registrados excluindo as edições de reversão (cuidado para não confundir edição de reversão e edição revertida). A segunda tabela é igual à primeira, só que considerando apenas edições de usuários com mais de 1000 edições (como na linha azul do gráfico no início do tópico). Também fiz este gráfico com os dados da coluna 'média' da primeira tabela. As colunas sobre as médias de bytes por edição mostram um leve aumento nos últimos anos e uma subida maior nos últimos meses. Danilo.mac(discussão) 04h35min de 30 de novembro de 2013 (UTC)[responder]

Eu acho que vocês esqueceram uma coisa simples, a WP ainda estava em construção em 2006 e agora já possui quase tudo o que precisa ter. Leandro LV (discussão) 23h09min de 1 de dezembro de 2013 (UTC)[responder]

Já diziam isso quando a WP portuguesa tinha 500 mil artigos. GoEThe (discussão) 23h43min de 1 de dezembro de 2013 (UTC)[responder]
E, de fato, estavam todos certos. Os artigos acessíveis à patuleia acabam rapidamente (thank God!) - e são criados na velocidade da cultura pop (futebol, novelas etc.). A colaboração tende a se tornar cada vez mais restrita daqui pra frente. Vejo isso nos temas que colaboro e vejo isso claramente na enwiki: para fazer uma contribuição relevante (que não seja copidesque) em temas "acadêmicos", é preciso entender do assunto pra não ser revertido de imeadiato. José Luiz disc 01h17min de 2 de dezembro de 2013 (UTC)[responder]
Sim, e quem "reverte de imediato", pela nossas regras, não precisa nem saber escrever. E só apertar botão.--Arthemius x (discussão) 10h27min de 2 de dezembro de 2013 (UTC)[responder]

Citação: Leandro LV escreveu: «a WP ainda estava em construção em 2006 e agora já possui quase tudo o que precisa ter.»

Não apenas a Wiki não tem nem 20% do que precisava ter, mas uns 30% do que tem é completamente irrelevante para existir aqui. MachoCarioca oi 10h33min de 2 de dezembro de 2013 (UTC)[responder]

Citação: José Luiz escreveu: « vejo isso claramente na enwiki: para fazer uma contribuição relevante (que não seja copidesque) em temas "acadêmicos", é preciso entender do assunto pra não ser revertido de imeadiato.»

Já aqui, uma votação decide tudo, mesmo que a maioria dos votantes seja de curiosos que querem votar em qualquer coisa e não tenha a menor ideia do assunto em que vota. Digo de cadeira .... se este lugar proibisse "egotrips", as votações de determinados assuntos seriam completamente selecionadas... E mais, quanto mais ignorante sobre tudo é o editor, mas ele se acha em condição de votar um assunto que não domina. Quando vc vê certas figuras que só editam aqui em musicas de cantores teen, futebol, novela ou atriz pornô e mal sabem escrever uma redação escorreita, decidirem votações sobre Astronáutica, é que a coisa tá pra lá de feia e explica um pouco a queda nas contribuições...Sds MachoCarioca oi 10h39min de 2 de dezembro de 2013 (UTC)[responder]

Não me parece que a razão da diminuição de contribuições seja motivada por a wiki " possuir quase tudo o que precisa ter " ou coisa semelhante. Qualquer um que pegue num livro que não seja romance, facilmente encontra temas e informação para novos artigos. Eu diria que faltam muitas centenas de milhares de artigos, para não dizer mesmo, que faltam milhões de artigos. Acho que um dos grandes problemas da wiki é o mau ambiente existente e a forma como se apoiam os novos editores (serão apoiados, ou serão expulsos ?). As mensagens que se deixam nas PDUs, robotizadas, completamente impessoais, agressivas, etc. Claro que o vandalismo feito propositadamente deve ser tratado duramente mas muitas vezes, diria mesmo com um frequência assustadora, se rotula de vandalismo as edições de editores que desconhecem as regras mas que fizeram alguma edição com boas intenções..... --João Carvalho deixar mensagem 11h19min de 2 de dezembro de 2013 (UTC)[responder]
João, e por que o grupo interessado no tema não se mobiliza pra resolver isso ao invés de perder horas e horas discutindo PEs? Me parece que é estão tentando salvar a Amazônia abraçando árvore por árvore.... José Luiz disc 11h28min de 2 de dezembro de 2013 (UTC)[responder]
Segundo as opiniões mais costumeiras, leva dez vezes mais tempo arrumar um artigo do que apagá-lo para rescrever de novo. Como é possível então dar vazão a correção dos artigos se os grupos não estão numa proporção de 10 para 1? OTAVIO1981 (discussão) 11h44min de 2 de dezembro de 2013 (UTC)[responder]
Divisão de trabalho. Mais importante que abraçar árvore a árvore (salvar PEs) seria: (i) marcar as páginas com AWB com a marca do projeto; (ii) separá-los por assunto permitindo que interessados ajudem nos temas de gosto pessoal; (iii) priorizar os casos mais urgente (BPV? mais antigos?).... Enfim, abordar o tema profissionalmente (como seu grupo fez com os filtros/CAPTCHA) e não à lá "rede social". Essa ação certamente irá minar os argumentos do grupo contrário naturalmente. Tem gente a fim? Depois de um ano, o "Projeto de Salvamento" sequer sabe o tamanho do problema.... E ainda reclamam quando o outro time se engaja mais. José Luiz disc 12h10min de 2 de dezembro de 2013 (UTC)[responder]
  • Acabei de calcular os números de novembro e republico a tabela com estas informações:
2012 2013
ago set out nov ago set out nov
C A I 9235 8679 8660 8736 7979 10580 10970 11011
T E T I 14499 13834 13867 13730 15229 16172 16717 16206
% 63,7% 62,7% 62,5% 63,6% 52,4% 65,4% 65,6% 67,9%
  • Em novembro o filtro 113 estava ativado no modo desautorizar o que justifica um leve aumento no número CAI. Neste trimestre (set, out, nov) o aumento foi de 3,4% em média o que significa 6,8% na redução das edições. Não sei justifica o efeito observado pelo Danilo.mac mas é uma componente que deve ser incluida na análise.OTAVIO1981 (discussão) 11h38min de 2 de dezembro de 2013 (UTC)[responder]
Enquanto isso, a Wikipédia em sueco tem quase o dobro do tamanho da wiki.pt, mas 99% de seus artigos são lixos robóticos sobre espécies (e com fontes, robóticas também). Este projeto (não digo a wiki.pt, mas a Wikipédia em geral) está a cada dia mais ridículo e irrelevante. Albmont (discussão) 11h53min de 3 de dezembro de 2013 (UTC)[responder]
Tempo entre a primeira e a última edição.

Para quem se interessar, fiz uma pesquisa sobre retenção de usuários, considerando para todos usuários que editaram pela primeira vez em um mês, o período decorrido até sua última edição. A query e a tabela estão aqui, o gráfico está ao lado. O gráfico mostra que o número de usuários que editaram por mais de uma semana e mais de um mês desde sua primeira edição não variou muito com os anos, mas o número de editores que editaram por mais de um ano (linha azul) vem caindo desde 2009, mostrando que a Wikipédia lusófona não está retendo editores por mais de um ano como antigamente. Danilo.mac(discussão) 03h40min de 5 de janeiro de 2014 (UTC)[responder]

Recuperação do número de edições[editar código-fonte]

Gráfico atualizado para 2014, com dados por semana

Atualizei o gráfico com números de 2014. A desativação do CAPTCHA no começo do ano fez as edições de IPs subirem, mas estão subindo em um ritmo mais lento do que aconteceu no meio de 2013. O número de edições de registrados com mais de 1000 edições se recuperaram felizmente. Fazendo algumas contas, baseado em pesquisas que mostram que 25% das edições de IPs são revertidas, o número de edições revertidas aumentaram em aproximadamente 700 por semana, e o numero de edições de registrados com mais de 1000 edições aumentaram em aproximadamente 5000 por semana, em relação ao último trimestre de 2013, o que sugere que a recuperação no número de edições se deve principalmente a edições não relacionadas com aumento de vandalismo. Danilo.mac(discussão) 19h50min de 7 de abril de 2014 (UTC)[responder]