Abstract:
Abstrak. Air sungai mempunyai peranan yang sangat strategis dalam kehidupan manusia dan makhluk hidup lainnya. Air
merupakan sumber daya alam yang penting bagi pemenuhan hajat hidup orang banyak sehingga perlu dilindungi agar dapat
bermanfaat secara optimal bagi kehidupan. Parameter yang digunakan dalam perhitungan Indeks Kualitas Air yaitu Total
Suspended Solid, Dissolved Oxygen, Biochemical Oxygen Demand, Chemical Oxygen Demand, Total Phospat, Fecal Coli
dan Total Coli. Data Mining merupakan sebuah proses ekstraksi informasi untuk menemukan pola yang tersembunyi pada
tumpukan data dalam database sehingga menjadi pengetahuan yang lebih bermakna. Salah satu fungsi data mining adalah
clustering (pengelompokan). Penelitian ini menguji kemampuan data mining khususnya algoritma k-means++ untuk
mengelompokan provinsi di Indonesia berdasarkan kualitas air sungainya.
Kata kunci: kualitas air, data mining, clustering, algoritma k-means++