텍스트마이닝을 이용한 학교 급식 메뉴의 동시출현 네트워크 패턴 분석: 2021–2023년 나이스 급식정보 개방 포털 급식식단 데이터를 활용한 탐색적 연구
Co-occurrence network and pattern of school lunch using big data and text-mining using data from the 2021–2023 school meal menu information on the NEIS open educational information portal: an exploratory study
Article information
Abstract
Objectives
This study aimed to use big data from elementary, middle, and high school lunches to determine the primary food groups and menu items that contribute to lunch meals through text-mining and investigate the variations in food groups and menu composition patterns across different grade levels.
Methods
Between 2021 and 2023, a total of 7,892,456 lunch menus from 17 cities and provinces in South Korea were analyzed using big data from the National Education Information System (NEIS) system. After undergoing text preprocessing for text-mining, the collected menus were classified into 34 food groups based on primary ingredients and cooking methods, excluding the types of rice and kimchi. Subsequently, analyses of term frequency, term frequency-inverse document frequency (TF-IDF), centrality, and co-occurrence networks were performed on the food group and menu data.
Results
According to the TF-IDF, the most frequent food group across all grade levels was soup and seasoned vegetables, whereas milk was the most frequently provided menu. As the grade level increased, the frequency of grilled and fried food increased. In elementary schools, fruits exhibited the highest centrality, whereas soup had the highest centrality in middle and high schools. Co-occurrence frequency revealed that the soup-fruit combination was the most common in elementary schools, whereas soup and seasoned vegetables were most frequently paired in middle and high schools. The co-occurrence network of food groups and menus further indicated that menus regularly provided as standard meals and those frequently offered as special meals formed distinct communities.
Conclusion
This study investigated the food groups and menu provision patterns in school meals through text-mining techniques applied to large-scale school lunch. The findings may contribute in enhancing the quality of nutritional management, school foodservice, and menu composition of school meal programs.
INTRODUCTION
학교 급식은 학생들의 건강과 발달에 큰 영향을 미치는 주요 영양 공급원으로 성장기 아동과 청소년의 식습관 형성에 중요한 역할을 한다[1]. 청소년기에 형성된 식습관은 성인기까지 영향을 미치므로 학교 급식을 통해 균형 잡힌 영향을 제공하는 것은 장기적인 건강 증진에 필수적이다. 교육부의 2023학년도 학교 급식 실시 현황 자료에 따르면 우리나라 전국의 초등학교, 중학교, 고등학교, 특수학교를 포함한 12,038개교에서는 전면 급식을 제공하고 있으며 매년 평균 526만 명의 학생들이 이용하고 있다[2]. 국내 학교 급식은 지역과 학교급에 따라 다양한 음식군과 메뉴를 제공하고 전통적인 식단 요소와 현대적인 식사 선호도를 반영하는 것이 특징이다[3]. 학교 급식의 구성은 시대의 흐름에 맞춰 제공되는 식품과 조리법이 다양해짐에 따라 메뉴의 종류가 늘어나고 동시에 식단의 다양성을 나타내고 있다[4]. 이에 학교급에 따른 급식의 구성 음식군과 메뉴를 다각적인 측면에서 분석하는 것은 학교 급식의 질을 향상 시키고 학생들의 건강한 식습관을 장려하는데 기초 자료로 활용될 수 있다.
빅데이터를 활용한 연구는 의학, 경영학, 소비자학 등 다양한 분야에서 사용되고 있다. 규모가 방대하고 수치 데이터뿐만 아니라 텍스트를 포함한 비정형 대규모 자료를 기반으로 수행된다[5]. 텍스트마이닝(text-mining)은 자연어 처리 기술을 활용하여 텍스트 기반 데이터에서 기존에 규명되지 않은 패턴, 지식, 새로운 정보를 추출하는 방법이다[6]. 텍스트마이닝을 포함하여 다양한 분석 기법이 개발됨에 따라 빅데이터의 대용량 데이터 처리가 가능해졌고 텍스트를 양적 데이터로 변환하여 통계적 분석 기법을 적용해 유용한 결과를 탐색하는 다양한 연구가 수행되고 있다[7]. 그러나, 학교 급식과 관련된 분야에서 전국의 학교 급식 메뉴를 다년간에 걸쳐 수집하고 빅데이터를 활용하여 텍스트마이닝 기반의 주요 음식군과 메뉴 키워드를 중심으로 초등학교, 중학교, 고등학교 학교급에 따라 급식 구성의 특징과 패턴을 분석한 연구는 드문 실정이다. 최근 3년간의 학교 급식 데이터를 활용하여 전국 학교 점심 식단 중 다빈도 제공 메뉴의 빈도 수를 조사하고 변화 추이를 분석한 연구[8]가 발표되었으나 본 연구에서는 초등학교, 중학교, 고등학교 학교급에 따라 제공되는 메뉴와 식품군의 중심성을 바탕으로 동시출현 네트워크와 조합 패턴 분석을 수행함으로써 식단내 메뉴와 식품군 간의 관계 분석에 차별성을 목적으로 하였다.
학교 급식에서 제공되는 음식군과 메뉴 그리고 그들의 조합은 학생들의 성장 단계에 따른 영양 요구를 충족하기 위해 구성되어야 한다. 선행 연구에서는 주로 급식의 영양소 공급량 및 섭취량[9-13], 학교 급식 제공 메뉴의 특성[14], 기호도 및 만족도 등을 수행하였다[15-17]. 특히, 학교급에 따라 중심적으로 제공되는 음식군과 메뉴를 바탕으로 이들 간의 조합이 어떤 패턴을 형성하는지에 대한 심층적인 분석이 상대적으로 부족하다. 학교급에 따른 급식 내 주요 음식군과 메뉴의 동시출현 관계와 중심성을 분석함으로써 학교 급식에서 중요한 역할을 하는 음식군과 메뉴 기반의 식단 구성 패턴을 이해할 수 있다. 이를 통해 학교 급식이 학생들의 균형 잡힌 영양 공급과 건강한 식습관 형성에 기여할 수 있을 것으로 사료된다.
본 연구는 전국 17개 시도 초등학교, 중학교, 고등학교의 학교 급식 식단 관련 빅데이터 기반의 텍스트마이닝을 활용하여 제공되는 음식군 및 메뉴 항목의 빈도, 중심성, 동시출현 관계를 분석함으로써 학교급에 따른 급식 구성의 특징과 패턴을 파악하고자 한다. 이를 통해 학교급에 따라 차별화된 급식 제공 방식이 학생들의 영양 요구에 어떻게 부합되는지 탐색하고자 한다. 연구 목적은 크게 세가지로 구분할 수 있다. 첫째, 초등학교, 중학교, 고등학교 급식에서 제공되는 주요 음식군과 개별 메뉴 항목의 빈도를 분석하여 학교급에 따른 구성 차이를 파악한다. 둘째, 음식군 및 메뉴의 네트워크 분석을 통해 학교급에 따라 급식에서 중심적인 역할을 하는 음식군과 메뉴를 도출하고 급식 구성의 핵심 요소를 식별한다. 셋째, 주요 음식군과 메뉴 간의 동시출현 패턴을 분석하여 학교급에 따른 급식에서 중요한 음식군 및 메뉴 간의 조합을 탐색하고 이러한 조합이 학생들의 영양 요구에 부합하는지 평가한다.
METHODS
Ethics statement
This study utilized fully anonymized, publicly available datasets. The data used in this research do not contain any personally identifiable information and were anonymized and made publicly accessible by the data provider. As this study uses anonymized, publicly available data, it does not require approval from an Institutional Review Board. The use of the data adhered to the ethical guidelines and terms of use provided by the data provider. Before conducting the study, the terms of use were thoroughly reviewed and strictly followed.
1. 연구설계
본 연구는 탐색적 조사연구로 학교 급식 데이터의 동시출현 네트워크와 패턴을 분석하기 위해 교육행정정보시스템 나이스(National Education Information System, NEIS) 교육정보 공개 포털 제공 자료로부터 기초 자료를 수집하고 분석하였다.
2. 자료수집 및 과정
본 연구에서는 초등학교, 중학교, 고등학교 학령에 따른 급식 중 점심 식사를 중심으로 다빈도 음식군과 메뉴를 추출하여 학교급에 따른 특징적인 식단 구성 패턴을 비교하고자 하였다. 연구에 사용된 데이터는 17개 시도 교육청 및 교육부가 제공하는 NEIS 교육정보 개방 포털(open.neis.go.kr)의 급식 식단 데이터를 활용하였다. 2021년 1월 1일부터 2023년 12월 31일까지 배식된 전국 17개 시도의 점심 급식 식단 총 7,892,459건의 데이터를 수집하였다.
텍스트마이닝 기법을 활용하여 급식 식단의 메뉴명 키워드를 중심으로 빅데이터 분석을 실시하였다. 수집된 비정형 텍스트 데이터는 Python 3.12 프로그램(Python Software Foundation)을 사용하여 전처리 과정을 수행하였고 본 연구 주제와 관련성이 없는 불용어(완제품, 자율 등), 유치원 및 특수학교 데이터(665,569건), 중복 데이터(5,006건)를 제거하였다. 학교 급식 식단의 기본 구성은 일반반상, 일품반상, 면상으로 분류한다. 반상에 포함되는 일반반상과 일품반상의 식단은 밥, 국, 반찬으로 구성된 3첩 반상을 기본으로 한다. 반찬은 주찬(고기•생선•달걀•콩류), 부찬(채소류), 김치 각각 1가지를 기본 구성으로 한다. 과일 및 후식류와 우유 및 유제품류는 선택적으로 추가 제공된다. 학교 급식에서 밥류와 김치류는 일품반상 및 면상이 제공되는 경우를 제외하고 대부분의 식단에 포함되는 보편적인 메뉴이다. 이러한 이유로 예비 선행 연구 수행 결과, 밥류와 김치류는 다른 음식군 및 메뉴와의 동시출현 빈도가 높아 본 연구의 주된 목적 중 하나인 음식군과 메뉴 간의 연결 구조 분석을 어렵게 하는 요인으로 작용하였다. 따라서 본 연구에서는 밥류와 김치류를 분석 대상에서 제외하였다. 반면, NEIS 교육정보 개방 포털의 급식 식단 데이터에서 제공되는 메뉴 중 우유는 Lee 등[8]의 연구에서 언급된 바와 같이 우유급식으로 제공된 것인지 점심 급식의 후식(초코 우유, 딸기 우유, 바나나 우유 등)으로 제공된 것인지 명확히 구분하기 어려워 분석에 포함하였다. 현재의 데이터에서 구분이 어려울 뿐만 아니라 우유 급식 또한 학생들의 영양 섭취 및 건강 증진과 관련하여 학교 급식과 동일한 목적을 지향하고 있으므로 본 분석에서는 우유를 포함하였다. 분석에서 사용되는 용어의 통일을 위해 메뉴명의 불필요한 용어를 제거함으로써 정규화(삼색수제비국 → 수제비국, 꼬치어묵국 → 어묵국 등) 과정을 수행하였다. 요리의 주재료 및 조리법에 따른 음식군 그룹화는 질병관리청 제9기 1차년도(2022) 영양조사 코드자료집 KDCA (Korea Disease Control and Prevention Agency, 2024)[18]의 음식 그룹을 기반으로 하고 조리법과 재료의 종류에 따라 세분화하여 분류하였다[8]. 결과적으로 총 34개의 그룹(곡류, 서류, 떡류, 면류, 만두류, 국류, 탕류, 찌개류, 전골류, 구이류, 볶음류, 전류, 적류, 부침류, 찜류, 조림류, 튀김류, 생채류, 숙채류, 샐러드류, 무침류, 장아찌류, 절임류, 장류, 양념류, 과일류, 우유류, 발효음료류, 빙과류, 다류, 과채음료류, 빵류, 과자류, 죽•스프류)으로 구분하였다.
3. 텍스트마이닝 분석
전국 17개 시도의 초등학교, 중학교, 고등학교 점심 급식 식단 빅데이터의 비정형 데이터에서 의미 있는 키워드를 발견하기 위해 수집된 텍스트에서 특정 단어의 빈도수(term frequency, TF)와 데이터 내의 특정 단어 빈도수의 가중치를 고려하고 키워드의 중요성을 나타내는 term frequency-inverse document frequency (TF-IDF) 분석을 수행하였다. 선행연구의 분석법을 참고하여 본 연구에서는 주요 상위 키워드 20개를 추출하였다[19, 20]. 이는 후속 연구로 계획된 동시출현빈도 조사를 위한 절차의 일환으로 단순히 키워드 빈도를 기반으로 한 추출법과 달리 메뉴와 식품군 간의 동시출현 관계를 고려한 방식을 반영하였다.
텍스트 네트워크 분석을 위해 빈도(frequency)와 위세 중심성(eigenvector centrality) 방법을 사용하였다. 빈도가 높은 단어일수록 급식 식단에서 동시에 등장한 주요 메뉴라는 의미이고 네트워크에서 빈도는 노드가 동시에 출현하는 횟수를 나타낸다. 위세 중심성은 네트워크의 중심에서 노드가 위치하는 정도를 의미하고 해당 메뉴의 중요도 및 노드와 연결된 이웃 노드들의 중심성을 고려하면서 연결의 질적인 영향력을 반영한다[21]. 네트워크 분석에서 형성된 커뮤니티 구조의 식별을 위해 모듈성(modularity)을 평가 지표로 사용하였다[22]. 동시출현빈도 분석은 전체 텍스트 내 특정 범위에서 노드들이 함께 출현하는 주요 단어들의 연관성을 분석하는 방법으로 본 연구에서는 점심 급식 식단에서 동시에 출현하는 주요 음식들의 연관성을 측정하였다. 네트워크 시각화 분석을 위해 Networks package 3.2.1을 사용하였다. 본 연구에서는 학교급식 내 주요 음식군 및 메뉴 간의 연관성을 분석하고 각 음식군 및 메뉴의 동시출현 가능성에 대한 정보를 바탕으로 학교급에 따른 급식 식단 메뉴 구성의 특징과 식단 패턴을 분석하였다.
RESULTS
1. 음식군 빈도 및 TF-IDF 분석
학교 급식 점심 식단 텍스트 데이터에서 학교급에 따라 초등학교 336,277개, 중학교 260,455개, 고등학교 307,308개의 메뉴가 추출되었다. 추출된 메뉴들은 34개의 음식군으로 분류하였으며 학교급에 따른 음식군의 상위 키워드 빈도 및 TF-IDF 빈도 분석 결과는 Table 1과 같다. TF-IDF 분석을 통해 추출된 상위 20개의 음식군 키워드를 살펴보면 모든 학교급에서 국류가 가장 높은 순위를 나타냈다. 이어서 초등학교는 과일류, 무침류, 우유류, 구이류 순으로 나타났고 중학교는 무침류, 과일류, 구이류, 볶음류 순, 고등학교는 무침류, 구이류, 볶음류, 과일류 순으로 도출되었다. 이 순서는 학교급에 따른 음식군의 단순 빈도 분석 결과에서도 동일하게 나타났으며 가중치를 고려했을 때에도 학교 급식 메뉴 구성에 있어 자주 활용됨을 확인 할 수 있었다. 우유류의 TF-IDF는 초등학교에서 0.392로 네번째로 높게 나타났으나 중학교에서는 0.124로 14위, 고등학교에서는 0.129로 13위 순위를 나타냈다. 반면, 튀김류와 면류의 TF-IDF는 초등학교에서 0.182 (7위)과 0.127 (12위)로 나타났으나 중학교에서는 튀김류 0.228 (6위) 및 면류 0.168 (7위)을 확인할 수 있었고 동일한 순위로 고등학교에서도 튀김류 0.230 (6위) 및 면류 0.174 (7위)가 나타나며 초등학교와 비교했을 때 상대적으로 높은 순위를 보였다. 과채음료류의 TF-IDF는 초등학교에서 0.074 (15위), 중학교에서 0.134 (11위), 고등학교에서 0.147 (10위)로 높은 순위를 나타냈다.
2. 메뉴 빈도 및 TF-IDF 분석
학교급에 따른 급식 식단 데이터에서 메뉴명의 상위 빈도 및 TF-IDF 분석 결과는 Table 2와 같다. 모든 학교급에서 우유의 제공 빈도가 가장 높게 나타나 중요한 메뉴임을 알 수 있었다. 특히 초등학교는 우유의 TF-IDF가 0.858로 매우 높게 나타났다. 중학교 및 고등학교에서 우유의 제공 빈도수는 각각 108,694건과 154,095건으로 가장 빈도가 높은 메뉴지만 TF-IDF 값은 각각 0.350 및 0.324로 초등학교에 비해 급식에서 활용 중요도가 낮았다. 학교급에 따라 높은 TF-IDF를 나타내는 상위 5개의 메뉴를 살펴보면 초등학교에서는 우유, 사과, 요구르트, 파인애플, 오이무침 순이었고, 중학교에서는 우유, 요구르트, 사과, 오이무침, 쌈장으로 나타났다. 고등학교에서는 우유, 요구르트, 사과, 요거트, 케첩으로 나타났다. 초등학교 및 중학교의 학교급식 메뉴와 달리 고등학교에서 상위에 추출된 메뉴 중 케첩과 달걀프라이가 각각 0.153과 0.097로 상위 TF-IDF를 나타냈다(Supplementary Table 2). 반면 멜론, 수박, 키위, 딸기와 같은 과일 메뉴는 초등학교에서만 상위 20개 메뉴에 포함되었다.
3. 음식군과 메뉴의 연결 중심성 분석
동시출현 네트워크 분석에 앞서 학교급에 따라 추출된 음식군의 상위 키워드 간 연결 중심성 분석 결과는 Table 3과 같다. 초등학교에서 음식군의 연결 중심성 결과는 Table 1의 TF-IDF 결과와 다르게 도출되었다. 과일류의 중심성은 0.420으로 국류 0.415보다 높게 나타났고 우유류는 0.407로 무침류 0.382보다 높았다. 이어서 구이류 0.276의 순서로 초등학교 음식군의 중심성이 나타났다. 반면 중학교에서는 음식군 상위 5개의 중심성 결과가 국류(0.451), 무침류(0.416), 과일류(0.337), 구이류(0.306), 볶음류(0.288) 순서로 앞선 TF-IDF의 순위와 동일했다. 고등학교에서는 국류(0.456), 무침류(0.394), 구이류(0.312)가 높은 중심성을 보였고 이어서 TF-IDF 순서와 다르게 과일류(0.294)가 볶음류(0.290) 보다 높았다. 면류는 중학교와 고등학교에서 TF-IDF 순위가 각각 7위와 8위였으나 키워드 간 연결 중심성에서는 중학교 8위(0.155), 고등학교 10위(0.161)로 다소 낮게 나타났다. 학교급에 따라 추출된 상위 메뉴 키워드 간의 연결 중심성 결과는 Table 4와 같다. 메뉴 상위 5개의 연결 중심성 결과는 모든 학교급에서 TF-IDF의 순위와 다르게 나타났다. 상위 5개의 메뉴를 살펴보면 초등학교에서는 우유(0.638), 사과(0.240), 파인애플(0.183), 요구르트(0.172), 쌈장(0.156)의 순서였고, 중학교에서는 우유(0.402), 요구르트(0.263), 쌈장(0.260), 사과(0.207), 상추쌈(0.198)의 순서였으며, 고등학교에서는 우유(0.412), 사과(0.251), 요구르트(0.242), 김구이(0.237), 케첩(0.210)의 순으로 각각 높게 도출되었다. 특히 우유는 중학교(0.402)와 고등학교(0.412)에 비해 초등학교(0.638)에서 높은 연결 중심성을 나타냈다. Table 2의 TF-IDF 순서 결과와 다르게 초등학교와 중학교에서 쌈장이 상위로 추출되었고 고등학교에서는 김구이가 0.237로 높게 나타났다. Table 4에서는 TF-IDF 상위 20개의 키워드 메뉴에서 추출되지 않았던 숭늉(0.166)과 김치볶음(0.149)이 고등학교 메뉴에서 각각 9위와 13위로 높게 나타났다.
4. 음식군과 메뉴의 동시출현빈도 및 네트워크 분석
학교급에 따른 음식군 간의 상호 연결망을 알아보기 위해 군집화를 위한 동시출현빈도 분석을 실시하였고 결과는 Table 5와 같다. 동시출현빈도에서 초등학교는 국류-과일류가 가장 높은 빈도를 보였고 중학교와 고등학교는 무침류-국류의 빈도가 가장 높았다. 초등학교에서는 앞서 진행된 TF-IDF 및 연결 중심성 결과와 유사하게 우유류와 군집화를 이루는 음식군들이 높게 나타났다. 상위 5개의 동시출현빈도 결과를 살펴보면 초등학교는 국류-과일류(448,605건), 과일류-우유류(445,365건), 국류-우유류(438,027건), 국류-무침류(415,396건), 무침류-과일류(394,341건) 순으로 높게 나타났다. 중학교는 무침류-국류(187,362건), 국류-과일류(132,327건), 국류-구이류(129,315건), 볶음류-국류(124,532건), 무침류-과일류(114,626건) 순으로 나타났다. 고등학교는 무침류-국류(271,969건), 구이류-국류(199,563건), 국류-볶음류(196,233건), 국류-과일류(168,121건), 무침류-구이류(150,171건) 순이었다. 음식군의 연결 중심성과 동시출현빈도를 고려하여 시각화한 네트워크는 Fig. 1과 같다. 네트워크 연결망 내 키워드의 크기는 연결 중심성 지수를 이용하여 값이 클수록 키워드의 노드 크기도 크게 나타나고 음식군 간의 동시출현빈도가 높을수록 음식군 키워드 간의 엣지 연결선이 짙게 나타난다. 동시출현 네트워크 분석 결과, 초등학교는 크게 3개의 군집화를 이루는데 1) 과일류-국류-우유류-무침류-구이류-볶음류 등, 2) 튀김류-면류-발효음료류-양념류-과자류-샐러드류 등, 3) 장류-생채류-숙채류의 패턴을 나타냈다. 중학교에서도 3개의 군집화를 보였고 1) 국류-무침류-과일류-구이류-볶음류 등, 2) 튀김류-면류-발효음료류-양념류-샐러드류 등, 3) 우유류-과채음료류-과자류 등의 패턴 형성을 나타냈다. 고등학교에서는 3개의 군집화 형성을 보였는데 1) 국류-무침류-구이류-과일류-볶음류 등, 2) 튀김류-양념류-면류-과채음료류-우유류, 3) 장류-생채류-숙채류의 패턴을 보였다. 학교급에 따른 군집화 구성을 살펴보면 급식 구성이 크게 일반식과 특별식(일품반상, 면상)의 패턴으로 형성됨을 알 수 있었다.

Co-occurrence network of food groups on school lunch by subset of school age. (A) Elementary school, (B) middle school, (C) high school.
학교급에 따른 메뉴 키워드 간의 동시출현빈도 분석 결과는 Table 6과 같다. 초등학교에서는 이전 TF-IDF 및 연결 중심성 결과와 유사하게 사과-우유(61,451건)가 가장 높은 동시출현빈도를 나타냈다. 이어서 파인애플-우유(48,200건), 요구르트-우유(41,079건), 우유-바나나(38,419건), 우유-오이무침(35,900건) 순서로 상위 빈도를 나타냈다. 반면 쌈장-상추쌈 조합은 중학교(13,685건)와 고등학교(21,436건)에서 모두 높은 동시출현빈도를 보였다. 이어 중학교에서는 소고기미역국-잡채(5,401건), 사과-우유(4,976건), 떡볶이-어묵국(4,404건), 요구르트-우유(4,202건)가 높게 나타났다. 고등학교에서는 사과-우유(11,441건), 우유-바나나(11,435건), 우유-숭늉(10,394건), 우유-김구이(8,532건) 순서로 나타났다. 초등학교의 동시출현빈도 상위 20위 목록에서 상추쌈-쌈장(14위)을 제외하고 모두 우유와 함께 동시출현 조합이 높게 나타났다. 반면 중학교에서부터 상위 5개를 제외한 동시출현 메뉴 조합에서 우유와 함께 동시출현 조합이 되지 않은 경우가 나타나는데 단무지-요구르트(3,775건), 쌈장-된장찌개(3,009건), 요구르트-달걀파국(2,992건), 떡볶이-단무지(2,881건), 오이무침-요구르트(2,788건), 단무지-달걀파국(2,684)이 포함되었다. 이와 유사하게 고등학교에서도 요구르트-단무지(6,819건), 떡볶이-어묵국(6,713건), 단무지-달걀파국(5,318건), 쌈장-된장찌개(4,694건), 요구르트-달걀파국(4,655건), 사과-김구이(4,051건), 오이무침-요구르트(4,021건)가 포함되었다. 메뉴의 연결 중심성과 동시출현빈도를 고려하여 시각화한 네트워크는 Fig. 2와 같다. 초등학교에서는 총 3개의 메뉴 군집이 형성되었는데 1) 우유-오이무침-바나나-수박-시금치무침 등, 2) 사과-파인애플-떡볶이-멜론-콩나물무침 등, 3) 요구르트-쌈장-소고기미역국-방울토마토-숙주무침-멸치볶음 등의 패턴을 보였다. 중학교에서는 1) 우유-사과-오이무침-콩나물무침-김구이 등, 2) 요구르트-떡볶이-어묵국-단무지 등, 3) 쌈장-상추쌈-파인애플-아욱된장국 등, 4) 소고기미역국-잡채로 총 4개의 메뉴 기반 식단 패턴 군집을 형성하였다. 고등학교에서는 1) 우유-사과-김구이-케첩-요거트-바나나 등, 2) 요구르트-오이무침-과채류음료-달걀프라이-어묵국-단무지 등, 3) 쌈장-콩나물무침-상추쌈-파인애플 등의 총 3개의 식단 패턴 군집을 나타냈다.
DISCUSSION
본 연구는 텍스트마이닝 기법을 활용하여 전국 17개 시도 초등학교, 중학교, 고등학교 급식 중 점심 식단에서 학교급에 따라 선호되는 주요 음식군 및 메뉴 키워드를 추출하고 동시출현 네트워크 분석을 통해 급식 식단 메뉴 구성의 특징과 패턴을 탐색했다.
음식군의 빈도 분석에서 국류, 과일류, 무침류가 모든 학교급에서 상위 항목으로 나타났다. 빈도 분석 결과와 유사하게 음식군 네트워크의 중심성 결과에서도 국류와 무침류가 모든 학교급에서 높게 나타났다. 이는 모든 학교 급식에서 국류와 무침류가 급식 내 주요 구성 요소로서 중요한 역할을 의미한다. 16개 시도 초등학교, 중학교, 고등학교에서 제공된 식단에서 국 및 찌개류가 87.6%의 비율을 차지하고 이 중 국류는 72.4%로 높게 나타났다[23]. 한국 급식 문화에서 국류는 전통적인 식단 구성 요소로 중심적인 역할을 하고 있다. 그러나, 성장기 어린이와 청소년의 높은 국류 섭취는 나트륨 섭취량 증가와 관련이 있고 나아가 청소년기의 질병 발생 위험 가능성을 나타낸다[24, 25]. 각 시도 교육청에서는 국 및 찌개류 내 나트륨 섭취 저감화를 위해 ‘국 자율의 날’을 지정하고 학생들의 자율 배식 형태로 운영할 수 있도록 권고하고 있다. 국류와 함께 무침류가 높은 중심성을 보이는 것은 무침의 주재료인 채소를 활용한 메뉴의 빈도가 높은 것을 의미한다. 전국 초등학교의 코로나 시기 전후 급식 메뉴별 제공 횟수 비교에 따르면 무침류 중 오이무침 메뉴는 전체의 5.9%로 높은 제공 횟수를 나타냈다[26]. 이는 본 연구 결과와 유사하며 무침류의 사용이 급식 식단 구성에서 균형 잡힌 영양 공급을 위한 식단 설계의 일환으로 사료된다. 높은 빈도와 중심성을 바탕으로 음식군 및 메뉴의 동시출현 패턴에서도 모든 학교급에서 국류와 다양한 과일류, 무침류, 구이류 메뉴의 조합이 가장 자주 제공되고 있음을 나타냈다.
학교급에 따른 차이점을 비교할 때, 초등학교에서는 우유 및 유제품류의 빈도가 높고 중학교와 고등학교에서는 상대적으로 구이류와 볶음류가 높게 나타났다. 음식군에 이어 주요 메뉴 항목에서도 우유는 모든 학교급에서 가장 높은 TF-IDF를 나타냈는데, 특히 초등학교에서 가장 높게 나타났다. 이는 나이와 성장 발달 단계에 따라 학생들의 영양 요구량과 기호도를 반영한 결과로 사료된다. Chang & Kim [27]에 따르면 2020년 초등학교의 우유 급식 비율은 41.0%, 중학교 17.3%, 고등학교 15.9%로 중학교와 고등학교에 비해 초등학교에서 높은 비율로 시행되고 있다. 초등학교 급식에서 우유 및 유제품의 제공 빈도가 높은 것은 성장기 어린이에게 필요한 칼슘과 동물성 단백질 등을 충분히 공급할 수 있도록 급식에서 자주 활용되고 있음을 나타낸다. 반면, 중학교와 고등학교 급식에서 구이류와 볶음류는 초등학교에 비해 높은 빈도와 중심성을 나타냈다. 이러한 결과는 성장기 후반에 요구되는 에너지와 영양 보충을 고려함과 동시에 고학년 학생들의 기호를 반영한 다양한 조리 형태의 식단 구성이 이루어지고 있음을 유추해 볼 수 있다. 지역별 고등학생 급식 식단의 선호 메뉴 기호도 연구에서 볶음류와 튀김류가 가장 높은 기호도를 나타내는 음식군으로 나타났다[16, 28]. 학생의 기호도는 급식 식단 구성시 중요하게 고려되는 요인으로 중학교 및 고등학교에서 볶음류와 튀김류의 선호도가 높음에 따라 다른 음식군에 비해 자주 활용된다[29]. 본 연구의 관련된 메뉴 항목에서 중학교 및 고등학교 급식 식단 중 돈가스 메뉴가 높은 TF-IDF를 보였고, 돈가스 메뉴는 청소년부터 성인까지 높은 선호도를 바탕으로 급식 식단에서 자주 제공되는 메뉴로 활용되고 있다[15, 30, 31].
학교급에 따라 급식 메뉴의 동시출현 패턴 분석 결과, 메뉴 구성에 있어 초등학교에서는 우유와 사과, 바나나 등의 과일이 함께 제공되고 고등학교에서는 상추쌈과 쌈장을 조합한 메뉴의 구성이 특징적이었다. 이러한 메뉴 조합은 각각 성장기 아동 및 청소년의 영양 요구와 식사 기호도를 반영한 결과로 사료된다. 초등학교 급식에서 우유와 과일이 함께 제공되는 것은 성장기에 필수적인 다양한 비타민과 무기질 섭취를 도모하고 정제 당류 저감화의 전략으로 볼 수 있다. Lee 등[26]에 따르면 코로나 발생 이전에 비해 초등학교 급식에서 오렌지, 키위 등과 같은 과일류의 제공 횟수가 유의적으로 더 증가했음을 나타냈다. 뿐만 아니라 학교 급식 기본 지침에 따르면 학생들의 당류 저감화를 위해 당 함량이 높은 가공 음료 및 빵류와 케이크류 등의 완제품 대신 과일류의 급식 식단 제공을 권고하고 있다[32, 33]. 중학교와 고등학교 급식에서 높은 동시출현 패턴 구성을 보인 조합은 상추쌈-쌈장-콩나물무침-된장찌개 메뉴 구성으로 급식 식단에서 상추쌈과 쌈장 조합을 기반으로 쌈밥 상차람의 기본 구성에 다양한 육류 등의 주반찬이 추가되어 제공되고 있음을 나타낸다. 고학년 학생일수록 쌈장과 같은 장류 및 소스류의 선호도가 높게 나타나고 급식 식단 메뉴에서 다양하게 활용되고 있다. 본 연구에서 모든 학교급의 상위 빈도 메뉴를 비교했을 때, 케첩 메뉴가 고등학교 급식에서 높은 빈도와 중심성을 나타냈다. 이는 학교 급식의 메뉴 구성이 시대의 흐름에 따라 서양식 메뉴의 제공 비율이 증가하고 학생들의 자기주도적 메뉴 선택에 따라 기호도가 높은 음식의 선호와 관련이 있다[4]. 그러나, 케첩 등을 포함한 소스류는 당 함량이 유의적으로 높아 학령기 청소년의 비만과 같은 질병 발생 위험성을 야기할 수 있다[13, 34]. 당 뿐만 아니라 학년이 올라갈수록 소스류를 통한 나트륨의 섭취도 증가하여 각 지역 교육청의 학교 급식 운영에서는 학생들의 건강을 위한 당 및 나트륨 저감화를 위해 다양한 급식 식단 구성 운영 방안을 제안하고 있다[10, 11]. 결과적으로 학교급별 동시출현 네트워크 분석을 통해 초등학교에서는 우유 및 과일류를 중심으로 다양한 메뉴가 결합되어 건강 지향적 영양 관리가 잘 이행되고 있음을 보여주고 중학교 및 고등학교는 기호도에 맞춰 장류 및 다양한 양념류 및 소스류를 포함한 식단 패턴을 형성하고 있음을 알 수 있다. 이를 통해 학교 급식의 연령별, 학교급별 특성을 반영한 맞춤형 급식 정책 개발의 기초 자료로 활용될 수 있음을 기대할 수 있다.
Limitations
본 연구 결과를 해석함에 있어 몇가지 한계를 유념할 필요가 있다. 첫째, 비록 분석된 데이터가 전국 17시도 초등학교, 중학교, 고등학교 지역의 급식 식단을 포함하지만 수집된 기간은 최근 3년으로 도출된 결과를 일반화하는데 제한이 있다. 본 연구 결과를 바탕으로 교육행정정보시스템을 통해 실시간으로 축적되는 학교 급식 식단 메뉴 데이터를 활용함으로써 대규모 빅데이터 수집을 통해 결과의 타당도와 신뢰도 분석을 수행할 수 있다. 둘째, 본 연구의 급식 식단 정보는 영양사 및 영양교사가 설계한 식단으로 학생들의 기호도나 만족도를 직접 반영하지 못한 한계가 있다. 셋째, 활용된 급식 식단 정보는 학생들에게 제공된 식단 구성 메뉴로 실제 섭취량을 측정할 수 없는 제한점이 있다. 향후 급식 식단의 잔반량 측정을 통해 섭취량을 고려한다면 급식 식단을 통해 학생들의 영양소 섭취량과의 연관성도 살펴볼 수 있을 것으로 사료된다. 넷째, NEIS의 식단에 포함된 우유가 우유급식인지 점심 급식의 후식류로 제공되는 것인지 명확히 구분하는데 한계가 있다. 추후 우유급식 데이터와 점심 급식 식단 데이터가 분리되어 관리가 된다면 보다 명확하고 정교한 결과 해석이 가능할 것이다. 이러한 제한점에도 불구하고 본 연구는 빅데이터 기반의 텍스트마이닝을 통해 주요 음식군과 메뉴 키워드를 바탕으로 학교급에 따른 식사 구성 패턴의 특징을 비교한 종합적인 탐색 연구로서 가치가 있다.
빅데이터와 텍스트마이닝을 바탕으로 학교 급식의 주요 구성 음식군과 메뉴를 추출하고 식단의 특징적인 패턴을 이해함으로써 학교급 맞춤 급식 정책 수립 및 개선에 기여할 수 있을 것으로 기대한다. 급식 식단 내 주요 음식군과 메뉴의 조합에 대한 분석 결과는 학교급에 따라 성장기 어린이와 청소년의 필수적인 영양소 공급 전략을 제시하는 필요한 실용적인 자료를 제공할 수 있다. 나아가 균형 잡힌 식단 구성의 필요성을 강조함으로써 학생들의 건강한 식습관 형성에 기여할 수 있을 것이다.
Conclusion
본 연구는 2021년부터 2023년까지 전국 17개 시도 초등학교, 중학교, 고등학교 학교 급식 빅데이터를 활용하여 점심 급식을 구성하는 주요 음식군과 메뉴를 텍스트마이닝을 통해 추출하고 학교급에 따른 식단 구성의 패턴 특징을 동시출현 네트워크 분석을 활용해 비교하였다. 모든 학교급에서 국류와 나물류가 높은 빈도로 제공되는 음식군으로 나타났고, 초등학교에서는 우유 및 유제품류가 중학교 및 고등학교에서는 구이류와 볶음류가 상대적으로 높게 나타났다. 메뉴 항목 중 우유는 모든 학교급에서 가장 높은 빈도로 제공되었다. 초등학교 급식 식단에서는 과일류가 가장 높은 중심성을 나타내었고 그 다음으로 국류와 우유 및 유제품류가 뒤이어 나타냈다. 중학교와 고등학교에서는 국류와 무침류가 가장 높은 중심성을 보였으나 초등학교에 비해 구이류와 볶음류가 상대적으로 높은 중심성을 나타냈다. 동시출현 패턴 분석을 통해 초등학교에서는 국류와 과일류 조합이 자주 나타나고 중학교 및 고등학교에서는 국류와 무침류의 조합이 높은 빈도로 제공됨으로써 특정 메뉴 간의 조합이 추출되었다. 위 결과를 바탕으로 학생들의 건강 증진을 도모하고 다양한 메뉴 기간의 학교 급식 식단 설계의 유용한 기반 자료로 활용될 수 있을 것으로 기대한다.
Notes
CONFLICT OF INTEREST
There are no financial or other considerations that might lead to conflict of interest.
FUNDING
This research was supported by Changwon National University in 2023–2024.
DATA AVAILABILITY
The dataset is publicly accessible via the NEIS open educational information portal (open.neis.go.kr).
SUPPLEMENTARY MATERIALS
Frequency of foods on school lunch by subset of school age.