Skip to content

Latest commit

 

History

History
172 lines (146 loc) · 5.39 KB

athiel.md

File metadata and controls

172 lines (146 loc) · 5.39 KB

#Ludność w gminach. Stan w dniu 31 marca 2011 r. - wyniki spisu ludności i mieszkań 2011 r.

Andrzej Thiel

##Źródło:

  1. Dane podbraem ze strony GUS: http://www.stat.gov.pl/gus/.

##Proces oczyszczenia danych:

  1. Do oczyszenia danych poslużylo mi narzedzie Google Refine

  2. Zawartosć pliku CSV zaladowalem do Google Refine

  3. Oczyscilem zaladowane dane do takiej postaci by móc póżniej skonwertować je do formatu json

  4. Przygotowane dane skonwertowałem do fomatu JSON.

Przykładowe dane po skonwertowaniu:

{
"Gmina": "G.Borzytuchom                         ",
"Symbol_terytorialny": 2201012,
"Ogółem": 2954,
"Miasto": "                 -",
"Wieś": 2954
}

#Agregacje

###Stany z populacją wiekszą niż 7000000 i mniejszą niż 15000000

coll.aggregate(
  { $group: {_id: "$state", totalPop: {$sum: "$pop"}} },
  { $match: {totalPop: {$gte: 7000000, $lte: 15000000}} }
)
{
        "result" : [
                {
                        "_id" : "PA",
                        "totalPop" : 11881643
                },
                {
                        "_id" : "OH",
                        "totalPop" : 10847115
                },
                {
                        "_id" : "MI",
                        "totalPop" : 9295297
                },
                {
                        "_id" : "FL",
                        "totalPop" : 12937926
                },
                {
                        "_id" : "NJ",
                        "totalPop" : 7730188
                },
                {
                        "_id" : "IL",
                        "totalPop" : 11430602
                }
        ],
        "ok" : 1
}

wykres

1. agregacja - wykres

###Pięć miast z najwiekszą populacją:

coll.aggregate(
   { $group: {_id: {state: "$state", city: "$city"}, maxPop: {$sum: "$pop"}} },
   { $sort: {maxPop: -1} },
   { $limit: 5 }
)
{
        "result" : [
                {
                        "_id" : {
                                "state" : "IL",
                                "city" : "CHICAGO"
                        },
                        "maxPop" : 2452177
                },
                {
                        "_id" : {
                                "state" : "NY",
                                "city" : "BROOKLYN"
                        },
                        "maxPop" : 2300504
                },
                {
                        "_id" : {
                                "state" : "CA",
                                "city" : "LOS ANGELES"
                        },
                        "maxPop" : 2102295
                },
                {
                        "_id" : {
                                "state" : "TX",
                                "city" : "HOUSTON"
                        },
                        "maxPop" : 2095918
                },
                {
                        "_id" : {
                                "state" : "PA",
                                "city" : "PHILADELPHIA"
                        },
                        "maxPop" : 1610956
                }
        ],
        "ok" : 1
}

wykres

2. agregacja - wykres

###Trzy stany z najmnejszą srednią populacją i sumą populacji wiekszą wiekszą niz 600000

coll.aggregate(
   { $group: {_id: {state: "$state", city: "$city"}, pop: {$sum: "$pop"}} },
   { $group: {_id: "$_id.state", avgCityPop: {$avg: "$pop"}, totalSum: {$sum: "$pop"}} },
   { $match: {totalSum: {$gte: 600000}} },
   { $sort: {avgCityPop: 1} },
   { $limit: 3 }
)
{
        "result" : [
                {
                        "_id" : "ND",
                        "avgCityPop" : 1629.591836734694,
                        "totalSum" : 638800
                },
                {
                        "_id" : "SD",
                        "avgCityPop" : 1826.7821522309712,
                        "totalSum" : 696004
                },
                {
                        "_id" : "MT",
                        "avgCityPop" : 2585.970873786408,
                        "totalSum" : 799065
                }
        ],
        "ok" : 1
}

wykres

3. agregacja - wykres