Por Que Idiomas E Dialetos - Essas São Coisas Completamente Diferentes - Visão Alternativa

Por Que Idiomas E Dialetos - Essas São Coisas Completamente Diferentes - Visão Alternativa
Por Que Idiomas E Dialetos - Essas São Coisas Completamente Diferentes - Visão Alternativa

Vídeo: Por Que Idiomas E Dialetos - Essas São Coisas Completamente Diferentes - Visão Alternativa

Vídeo: Por Que Idiomas E Dialetos - Essas São Coisas Completamente Diferentes - Visão Alternativa
Vídeo: A Língua Portuguesa e seus dialetos 2024, Pode
Anonim

Muitas vezes, perguntas simples têm respostas complexas. Por exemplo: qual é a diferença entre linguagem e dialeto? Se você decidir perguntar a um lingüista sobre isso, relaxe. Embora à primeira vista não haja nada de difícil nessa pergunta, ela pode ser respondida de diferentes maneiras.

A distinção entre linguagem e dialeto pode depender de um ponto de vista ou outro. Do ponto de vista político, a língua é o que as pessoas geralmente falam como nação. Por exemplo, de 1850 a 1992, existia a chamada língua servo-croata, que incluía vários dialetos, incluindo sérvio, croata e bósnio. Mas depois que a Iugoslávia se dividiu em vários estados independentes em meados da década de 1990, esses dialetos foram reconhecidos como línguas distintas. Esta definição política funciona em parte, embora traga consigo mais problemas do que soluções: há línguas que se falam em diferentes países, um exemplo notável disso é o espanhol na América Latina. Ninguém diria que o espanhol mexicano e o espanhol colombiano são línguas diferentes. Possivelmente espanhol, falado em partes da Espanha,tão diferente de suas variedades latino-americanas que merece ser chamada de uma língua separada, mas isso não está totalmente claro.

E se traçarmos a linha entre linguagem e dialeto, guiados pelo critério de compreensão mútua? Infelizmente, essa abordagem também não é ideal. Um dinamarquês compreenderá sueco um pouco melhor do que um sueco - dinamarquês. Da mesma forma, uma pessoa que fala o dialeto camponês específico do inglês britânico entenderá um americano de Los Angeles muito melhor do que um americano. A compreensão mútua freqüentemente depende de fatores externos - eles são uma variável bastante incontrolável - e não de propriedades inerentes da própria linguagem.

Então, talvez devêssemos adotar uma abordagem puramente linguística. Imagine que podemos medir sistematicamente a diferença (D) entre duas variantes de fala. O significado específico de D nos permitiria definir a fronteira entre dois dialetos e duas línguas. Encontrar tal valor não deve ser muito difícil, uma vez que as duas línguas podem ser comparadas de acordo com vários critérios, como inventário de sons, características gramaticais ou vocabulário.

Mas e se as diferenças entre as variações da fala forem graduais e a probabilidade de encontrar um determinado valor de D for tão alta quanto a probabilidade de encontrar outro valor? Então, teríamos que escolher um valor arbitrário de D como ponto de partida, e um valor arbitrário nos levaria de volta a considerações de natureza política ou prática que não pretendíamos considerar. Queremos que nossa linha de quebra esteja no nível em que sérvio e croata são idiomas diferentes ou um só? Catalogando as línguas do mundo, quantas milhares de línguas queremos mandar para o esquecimento: cinco? Ou sete? Talvez dez mil?

Nos últimos anos, dois obstáculos principais para distinguir entre linguagem e dialeto foram superados. A primeira é como medir as diferenças entre as variantes da fala - ou seja, encontrar um valor para D. Em 2008, um grupo de lingüistas criou o Programa de Julgamento por Similaridade Automatizada (ASJP), cujo curador diário e fundador é seu. O ASJP preparou meticulosamente um conjunto de dados de comparação sistemática de idiomas que atualmente contém 7.655 listas de palavras. Eles são relevantes para dois terços dos idiomas do mundo, assumindo que, para nossos propósitos, os idiomas são definidos pelo código padrão ISO 639-3. Como cada lista de palavras contém um conjunto fixo de 40 conceitos interpretados de forma consistente, é fácil compará-los e, assim, obter uma medida da diferença. A medida de diferença mais comumente usada entre duas palavras é a distância de Levenshtein, um termo em homenagem a Vladimir Levenshtein, um cientista soviético que, em 1965, desenvolveu um algoritmo para comparar duas cadeias de caracteres. Ele definiu "distância" como o número mínimo de substituições, inserções e exclusões necessárias para transformar uma linha em outra. A distância de Levenshtein pode ser utilmente dividida pelo comprimento da mais longa das duas linhas e, assim, colocar todas as distâncias em uma escala de 0 a 1. Esse fenômeno é conhecido como distância de Levenshtein normalizada, ou LDN. Ele definiu "espaçamento" como o número mínimo de substituições, inserções e exclusões necessárias para transformar uma linha em outra. A distância de Levenshtein pode ser dividida de forma útil pelo comprimento da mais longa das duas linhas e, assim, colocar todas as distâncias em uma escala de 0 a 1. Esse fenômeno é conhecido como distância de Levenshtein normalizada ou LDN. Ele definiu "distância" como o número mínimo de substituições, inserções e exclusões necessárias para transformar uma linha em outra. A distância de Levenshtein pode ser dividida de maneira útil pelo comprimento da mais longa das duas linhas e, assim, colocar todas as distâncias em uma escala de 0 a 1. Esse fenômeno é conhecido como distância de Levenshtein normalizada ou LDN.

O segundo obstáculo é que talvez "linguagem" e "dialeto" sejam conceitos que só podem ser definidos em uma ordem arbitrária. Aqui temos algumas notícias muito encorajadoras para você. Se olharmos para todas as famílias de línguas no banco de dados ASJP, onde os participantes do projeto incluíram uma proporção significativa de variedades estreitamente relacionadas, podemos começar a pesquisar diferentes tipos de comportamento de línguas e dialetos. Uma imagem intrigante surge diante de nós: as distâncias, via de regra, flutuam ou em torno de um valor relativamente pequeno, ou em torno de um valor relativamente grande, e uma depressão se forma entre eles. Como se constatou, na maioria das vezes esse vale está em uma faixa estreita, com média de cerca de 0,48 LDN. Não estaremos errados se dissermos que as variantes da fala tendem a não ser parcialmente semelhantes entre si em seu vocabulário básico. Ou há uma tendência de maior semelhança, caso em que as variantes da fala podem ser definidas como dialetos diferentes, ou menos semelhança, caso em que podem ser atribuídas a línguas diferentes. É aqui que reside a fronteira entre a linguagem e o dialeto.

Este fenômeno foi provavelmente o resultado de circunstâncias sociais. Os dialetos divergem conforme as pessoas se estabelecem em novos territórios e formam novas identidades, mas se ainda houver algum contato entre eles, a convergência pode ocorrer de forma que as variantes da fala permaneçam mais de 50 por cento semelhantes (e, portanto, a fala é sobre um idioma). No entanto, um leve empurrão para a divergência pode fazer com que as variantes de linguagem divergam de forma relativamente rápida, aumentando a distância de Levenshtein, caso em que podemos qualificá-las como línguas separadas. Pode haver uma relação entre o limite das distâncias entre as palavras na lista padrão usada pelo ASJP e as distâncias correspondentes em outras partes da estrutura da linguagem, o que pode levar a uma grave perda de compreensão. Em outras palavras,o limite de compreensão pode se correlacionar com o limite entre idiomas e dialetos. Ainda não estudamos esse assunto, mas como objeto de pesquisa é extremamente interessante.

Vídeo promocional:

Tendo chegado a um critério objetivo, em vez de arbitrário, para separar as línguas dos dialetos, podemos aplicá-lo às línguas do mundo. Alguns pares de variedades de fala consideradas línguas nacionais, como o bósnio e o croata, estão bem abaixo do limite LDN de 0,48 (o que significa que são a mesma língua, independentemente da existência da Iugoslávia). Não muito longe desse limite estão idiomas como hindi e urdu (dificilmente podem ser chamados de duas línguas diferentes). E variedades de árabe e chinês, que muitas vezes são vistas como as mesmas línguas, sobem acima de LDN = 0,48 (essas variedades são línguas diferentes). Na verdade, existem vários pares de variedades que geralmente são consideradas línguas diferentes, mas flutuam na fronteira: por exemplo, dinamarquês e sueco, que têm um LDN de 0,4921.

Finalmente, uma técnica derivada de conjuntos de dados, chamada cronologia ASJP, pode ser aplicada para estabelecer a quantidade de tempo que leva para os dialetos se distanciarem o suficiente para serem considerados idiomas separados. O resultado que encontramos é 1059 anos, se não levarmos em consideração algum erro. Essas descobertas são corroboradas pelo tempo que normalmente leva para a linguagem genérica de uma família de línguas se dividir em línguas filhas, que mais tarde se tornam ancestrais de subfamílias. Para isso, precisamos de outros métodos de análise, mas os resultados são semelhantes: leva cerca de um milênio para transformar dialetos em línguas. Sabemos disso porque agora podemos distinguir um do outro.

Søren Wichmann é um linguista dinamarquês que colabora com a Universidade de Leiden (Holanda), a Universidade Federal de Kazan (Rússia) e a Universidade Linguística de Pequim (China). Seu último livro, Temporal Stability of Linguistic Typological Features (2009), foi coautor com Eric W. Holman.

Recomendado: