luizgpsantos · May 4, 2024 16:31 · alvesoaj · Jul 6, 2015 · octamagalhaes · Sep 10, 2015
diff --git a/Exemplo completo b/Exemplo completo
 // Ao [criar o índice][0], especifique um [analyzer customizado][1] responsável por tratar palavras 
 // com caracteres especiais e o plural da lingua Portuguesa. Algumas palavras precisarão de uma 
 // sintonia fina, o que pode ser feito através de [stemmer overrides][2]. Além disso, ao criar um
 // campo atribua o analyzer a ele.

 PUT produtos
 {
  "settings": {
    "analysis": {
      "analyzer": {
        "analyzer_plural_acentos": {
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "custom_stems",
            "stemmer_plural_portugues",
            "asciifolding"
          ]
        }
      },
      "filter": {
        "custom_stems": {
          "type": "stemmer_override",
          "rules": [
            "televisoes => televisão"
          ]
        },
        "stemmer_plural_portugues": {
          "type": "stemmer",
          "name": "minimal_portuguese"
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "titulo": {
        "type": "text",
        "analyzer": "analyzer_plural_acentos"
      }
    }
  }
 }

 // Indexe os documentos, que podem conter acentos, maiusculas, plural, etc...

 PUT produtos/_doc/1
 {
  "titulo": "avelãs"
 }

 PUT produtos/_doc/2
 {
  "titulo": "televisão"
 }

 // Faça uma busca utilizando um termo sem acento ou no plural. O resultado deve conter os 
 // documentos com os termos acentuados e no singular.

 POST produtos/_search
 {
  "query": {
    "match": {
      "titulo": "televisoes"
    }
  }
 }

 // Outro exemplo de query...

 POST produtos/_search
 {
  "query": {
    "match": {
      "titulo": "AVELAS"
    }
  }
 }

 // Para entender como o analyzer customizado está gerando os tokens, podemos utilizar a [analyze API][3]:

 GET produtos/_analyze
 {
  "text": ["televisões", "televisoes", "AVELAS"],
  "analyzer": "analyzer_plural_acentos"
 }

 [0]: https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-create-index.html
 [1]: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-custom-analyzer.html
 [2]: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-stemmer-override-tokenfilter.html
 [3]: https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-analyze.html
	// Ao [criar o índice][0], especifique um [analyzer customizado][1] responsável por tratar palavras
	// com caracteres especiais e o plural da lingua Portuguesa. Algumas palavras precisarão de uma
	// sintonia fina, o que pode ser feito através de [stemmer overrides][2]. Além disso, ao criar um
	// campo atribua o analyzer a ele.

	PUT produtos
	{
	"settings": {
	"analysis": {
	"analyzer": {
	"analyzer_plural_acentos": {
	"tokenizer": "standard",
	"filter": [
	"lowercase",
	"custom_stems",
	"stemmer_plural_portugues",
	"asciifolding"
	]
	}
	},
	"filter": {
	"custom_stems": {
	"type": "stemmer_override",
	"rules": [
	"televisoes => televisão"
	]
	},
	"stemmer_plural_portugues": {
	"type": "stemmer",
	"name": "minimal_portuguese"
	}
	}
	}
	},
	"mappings": {
	"properties": {
	"titulo": {
	"type": "text",
	"analyzer": "analyzer_plural_acentos"
	}
	}
	}
	}

	// Indexe os documentos, que podem conter acentos, maiusculas, plural, etc...

	PUT produtos/_doc/1
	{
	"titulo": "avelãs"
	}

	PUT produtos/_doc/2
	{
	"titulo": "televisão"
	}

	// Faça uma busca utilizando um termo sem acento ou no plural. O resultado deve conter os
	// documentos com os termos acentuados e no singular.

	POST produtos/_search
	{
	"query": {
	"match": {
	"titulo": "televisoes"
	}
	}
	}

	// Outro exemplo de query...

	POST produtos/_search
	{
	"query": {
	"match": {
	"titulo": "AVELAS"
	}
	}
	}

	// Para entender como o analyzer customizado está gerando os tokens, podemos utilizar a [analyze API][3]:

	GET produtos/_analyze
	{
	"text": ["televisões", "televisoes", "AVELAS"],
	"analyzer": "analyzer_plural_acentos"
	}

	[0]: https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-create-index.html
	[1]: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-custom-analyzer.html
	[2]: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-stemmer-override-tokenfilter.html
	[3]: https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-analyze.html