District Name Matching using N-grams and Jaccard Similarity

This repository contains a Python notebook that automates the process of matching district names between two datasets: people_of_india_clean_2014.csv and minority_conc_census_2011.csv. The matching is performed using n-grams and Jaccard similarity to compare district names and identify the most similar pairs.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
ngram_district_matching_code.ipynb		ngram_district_matching_code.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

District Name Matching using N-grams and Jaccard Similarity

About

Uh oh!

Releases

Packages

Languages

bishmaybarik/ngram-code

Folders and files

Latest commit

History

Repository files navigation

District Name Matching using N-grams and Jaccard Similarity

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages