Snowball é uma família de línguas afins para a criação de línguas inglesas, francesas, alemãs, holandesas, russas, finlandesas, italianas, portuguesas, espanholas, suecas, norueguesas, dinamarquesas, e outras línguas.
Foi desenvolvido por Martin Porter e faz agora parte da biblioteca da NLTK.
A língua original Snowball foi concebida pelo Dr. Porter na década de 1980 como um stemmer baseado em regras para o inglês. O Dr. Porter também escreveu um artigo sobre o design da língua Bola de Neve.
As linguagens do Snowball foram concebidas para seguir o algoritmo de corte do Porter o mais de perto possível. Todos eles se baseiam na base original do código Snowball, mas foram adaptados para funcionar com línguas diferentes.
As línguas do Snowball são de código aberto e são divulgadas sob a licença BSD.
As línguas do Snowball são:
- Inglês
- Francês
- Alemão
- Holandês
- Russo
- Finlandês
- Italiano
- Português
- Espanhol
- Sueco
- Norueguês
- Dinamarquês
- e outras línguas