<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE article
  PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.1 20151215//EN" "https://jats.nlm.nih.gov/publishing/1.1/JATS-journalpublishing1.dtd">
<article article-type="research-article" dtd-version="1.1" specific-use="sps-1.9" xml:lang="en" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink">
	<front>
		<journal-meta>
			<journal-id journal-id-type="publisher-id">cjas</journal-id>
			<journal-title-group>
				<journal-title>Cuban Journal of Agricultural Science</journal-title>
				<abbrev-journal-title abbrev-type="publisher">Cuban J. Agric. Sci.</abbrev-journal-title>
			</journal-title-group>
			<issn pub-type="epub">2079-3480</issn>
			<publisher>
				<publisher-name>Ediciones ICA</publisher-name>
			</publisher>
		</journal-meta>
		<article-meta>
			<article-id pub-id-type="publisher-id">1996/v59e01</article-id>
			<article-id pub-id-type="other">00001</article-id>
			<article-categories>
				<subj-group subj-group-type="heading">
					<subject>Animal Science</subject>
				</subj-group>
			</article-categories>
			<title-group>
				<article-title>Classification of small-scale dairy production in the Ecuador-Colombia border area. A comparative study of automatic learning techniques</article-title>
			</title-group>
			<contrib-group>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-3039-7657</contrib-id>
					<name>
						<surname>Carvajal-Pérez</surname>
						<given-names>L.</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
					<xref ref-type="corresp" rid="c1">*</xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0003-0126-0704</contrib-id>
					<name>
						<surname>Montenegro-Arellano</surname>
						<given-names>F.</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0001-9029-9410</contrib-id>
					<name>
						<surname>Terán-Rosero</surname>
						<given-names>G.</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-5125-8752</contrib-id>
					<name>
						<surname>Urgilés-Urgilés</surname>
						<given-names>Gladys</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0009-0002-4350-413X</contrib-id>
					<name>
						<surname>Chulde-Chulde</surname>
						<given-names>Nayeli</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-7516-7521</contrib-id>
					<name>
						<surname>Cobo-Cuña</surname>
						<given-names>R.</given-names>
					</name>
					<xref ref-type="aff" rid="aff2"><sup>2</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-2641-1815</contrib-id>
					<name>
						<surname>Herrera-Villafranca</surname>
						<given-names>Magaly</given-names>
					</name>
					<xref ref-type="aff" rid="aff2"><sup>2</sup></xref>
				</contrib>
			</contrib-group>
			<aff id="aff1">
				<label>1</label>
				<institution content-type="original">Universidad Politécnica Estatal del Carchi, Antisana y Universitaria, Tulcán, Ecuador</institution>
				<institution content-type="normalized">Universidad Politécnica Estatal del Carchi</institution>
				<institution content-type="orgname">Universidad Politécnica Estatal del Carchi</institution>
				<addr-line>
					<state>Tulcán</state>
				</addr-line>
				<country country="EC">Ecuador</country>
			</aff>
			<aff id="aff2">
				<label>2</label>
				<institution content-type="original">Instituto de Ciencia Animal, C. Central, km 47 ½, San José de las Lajas, Mayabeque, Cuba</institution>
				<institution content-type="normalized">Instituto de Ciencia Animal</institution>
				<institution content-type="orgname">Instituto de Ciencia Animal</institution>
				<addr-line>
					<city>San José de las Lajas</city>
					<state>Mayabeque</state>
				</addr-line>
				<country country="CU">Cuba</country>
			</aff>
			<author-notes>
				<corresp id="c1">
					<label>*</label>Email: <email>luis.carvajal@upec.edu.ec</email>
				</corresp>
				<fn fn-type="conflict" id="fn1">
					<p><bold>Conflict of interest</bold>: The authors declare that there is no conflict of interest between them.</p>
				</fn>
				<fn fn-type="con" id="fn2">
					<p><bold>CRediT Authorship Contribution Statement:</bold> L. Carvajal-Pérez: <bold>Conceptualization, Investigation, Formal analysis, Writing- original draft.</bold> F. Montenegro-Arellano: <bold>Conceptualization, Investigation.</bold> G. Terán-Rosero: <bold>Methodology, Formal analysis.</bold> Gladys Urgilés-Urgilés: <bold>Funding acquisition, Resources.</bold> Nayeli Chulde-Chulde: <bold>Data curation.</bold> R. Cobo-Cuña: <bold>Validation.</bold> Magaly Herrera-Villafranca: <bold>Formal analysis, Writing- original draft</bold></p>
				</fn>
			</author-notes>
			<pub-date date-type="pub" publication-format="electronic">
				<day>01</day>
				<month>01</month>
				<year>2025</year>
			</pub-date>
			<pub-date date-type="collection" publication-format="electronic">
				<month>01</month>
				<year>2025</year>
			</pub-date>
			<volume>59</volume>
			<elocation-id>e01</elocation-id>
			<history>
				<date date-type="received">
					<day>10</day>
					<month>08</month>
					<year>2024</year>
				</date>
				<date date-type="accepted">
					<day>21</day>
					<month>11</month>
					<year>2024</year>
				</date>
			</history>
			<permissions>
				<license license-type="open-access" xlink:href="https://creativecommons.org/licenses/by-nc/4.0/" xml:lang="en">
					<license-p>This is an open-access article distributed under the terms of the Creative Commons Attribution License</license-p>
				</license>
			</permissions>
			<abstract>
				<p>The socioeconomic factors determining production in dairy farms were researched. The classification of small-scale farmers in the border area between Ecuador and Colombia was involved. A total of 532 farmers participated in the survey and the data collected was analyzed using automatic learning techniques. The data were subjected to an exhaustive preprocessing to remove errors and outliers related to socioeconomic factors in milk production in Carchi, Ecuador. Among the variables examined, economic income, the price per liter of milk and the quantity of liters used for cheese production emerged as the most influential factors. The results showed that automatic learning techniques can effectively classify small-scale dairy production, with accuracy above 96 %. The presence of a child who provides economic support to the house, the allocation of milk for the production and sale of cheese, together with its use for family consumption, significantly influenced 90 % of the surveyed participants.</p>
			</abstract>
			<kwd-group xml:lang="en">
				<title>Key words:</title>
				<kwd>classification models</kwd>
				<kwd>dairy productivity</kwd>
				<kwd>economic well-being</kwd>
				<kwd>small dairy farmers</kwd>
			</kwd-group>
			<counts>
				<fig-count count="8"/>
				<table-count count="2"/>
				<equation-count count="8"/>
				<ref-count count="47"/>
				<page-count count="0"/>
			</counts>
		</article-meta>
	</front>
	<body>
		<sec sec-type="intro">
			<title>Introduction</title>
			<p>Milk production is an important economic activity in the world. By 2023, milk production exceeded 950 million tons. In emerging economies, approximately 80 % of production comes from family farms with limited use of inputs, which translates into lower yields per animal. The 20 % of farms are medium and large, of which 4 % invest in technology to fulfill quality standards (<xref ref-type="bibr" rid="B13">FAO 2023a</xref>).</p>
			<p>In 2022, the European Union (made up of 27 countries) was the world's largest producer with 144 million tons. It was followed by the United States with 103 million tons and India with 97 million tons (<xref ref-type="bibr" rid="B30">Orús 2022</xref>). In Ecuador, approximately 6.15 million liters of milk were produced per day, which generated income for 1.3 million inhabitants (<xref ref-type="bibr" rid="B20">Ionita 2022</xref>). Milk production contributes 4 % to the country's agro-industrial gross domestic product and shows growth of 10.92 % compared to 2020. The Sierra region contributes 73 % of production, the Coast 19 %, and the Amazonian 8 % (<xref ref-type="bibr" rid="B8">CIL Ecuador, 2023</xref>).</p>
			<p>Milk production uses production factors including land, capital, labor, technology and, according to some authors, business management to transform them and contribute to improving the living conditions of farmers.</p>
			<p>The social factors with the greatest impact are gender, level of education, training, experience or associativity (<xref ref-type="bibr" rid="B47">Zemarku <italic>et al.</italic> 2022</xref>). Likewise, economic factors such as income, costs, herd size, and production volume were identified (<xref ref-type="bibr" rid="B45">Vásquez <italic>et al.</italic> 2022</xref>); in addition, the availability of land, foods, and veterinary care is essential in the production process (<xref ref-type="bibr" rid="B32">Peña <italic>et al.</italic> 2018</xref>), without neglecting innovations in the rearing system and the use of automation equipment for quality production (<xref ref-type="bibr" rid="B41">Tangorra <italic>et al.</italic> 2022</xref>).</p>
			<p>The dairy sector allows rural populations to produce and market their products, contributing to local economic development, food security, economic development and therefore a better quality of life for farmers (<xref ref-type="bibr" rid="B11">FAO 2022a</xref>). It is a sector that is always changing. It needs to invest in new technology to be efficient. This harms small farmers, who cannot afford to invest (<xref ref-type="bibr" rid="B18">Gil and Hernández 2019</xref>). In addition, the dairy value chain promotes small, micro and medium farmers by helping them process and sell dairy products (<xref ref-type="bibr" rid="B15">Gaudin and Padilla 2020</xref>).</p>
			<p>The study area includes the Carchi province, located in northern Ecuador, on the border with Colombia. The 63 % of the territory is in the humid temperate zone. It is between 1,800 and 3,000 m o. s. l and between 12 and 18 °C. The temperature depends on if the weather is dry or rainy (<xref ref-type="bibr" rid="B14">Franco 2016</xref>). The other 37 % is in the subtemperate region, which is very humid. It is in the low moors, between 3,000 and 4,000 m o. s. l. The temperature is 6 to 12 °C. The rainfalls are from 1000 to 1500 mm per year, with no month of maximum rainfall (<xref ref-type="bibr" rid="B35">Requelme and Bonifaz 2012</xref>).</p>
			<p>Carchi's dairy production ranks third in national production. It is based on families, has a strong presence in the informal market (<xref ref-type="bibr" rid="B26">Morocho <italic>et al.</italic> 2021</xref>), employs 36 % of the population (<xref ref-type="bibr" rid="B42">Terán and Cobo 2017</xref>). There are 8,957 livestock farms (<xref ref-type="bibr" rid="B33">Prefectura del Carchi 2023</xref>). </p>
			<p>The main system is extensive, with traditional practices and the presence of a lot of native cattle. The cows produce an average of 9.4 L per day. This is higher than the national average of 5.9 L (<xref ref-type="bibr" rid="B7">Carvajal 2014</xref>). Farms with Holstein cattle achieve yields of 15 to 18 L per cow per day (<xref ref-type="bibr" rid="B4">Balarezo <italic>et al</italic>. 2016</xref>), but they are only 6 % of the total.</p>
			<p>Agricultural production units (APU) have small milking facilities or stables, which reflects their limited economic capacity (<xref ref-type="bibr" rid="B46">Velasteguí 2019</xref>). In terms of land area, there is a large difference between farmer groups. Small farmers have an average of 3 ha. Medium farmers have 7 ha. Large farmers have 120 ha (<xref ref-type="bibr" rid="B35">Requelme and Bonifaz 2012</xref>).</p>
			<p>The average age of producers is 50 years old. This shows few young people and little generational change (<xref ref-type="bibr" rid="B25">Moreno 2018</xref>). In terms of education, 60 % of farmers have primary education, 25 % have secondary education and 15 % have university education. The production chain is not competitive, harms production and limits the agricultural sector in the region.</p>
			<p>Several tools are used around the world to evaluate socio-economic factors (SEF) and analyze strategies for sustainable agricultural and food development (<xref ref-type="bibr" rid="B10">FAO 2018</xref>). Today, the implementation of inclusive and sustainable artificial intelligence (AI) practices in agriculture provides solutions to achieve food and nutritional security. The AI is applied in agricultural robotics, soil and crop monitoring, as well as predictive analysis (<xref ref-type="bibr" rid="B12">FAO 2022b</xref>).</p>
			<p>Machine Learning (ML) is the field of study known as a scientific method or art, where computers can learn from data through programming (<xref ref-type="bibr" rid="B44">Valdez 2019</xref> and <xref ref-type="bibr" rid="B22">Kassahun <italic>et al.</italic> 2022</xref>). The data used for learning are called samples and are part of the training set. The part of the ML system that learns and makes predictions is called a model, which is commonly tested using the test set (<xref ref-type="bibr" rid="B16">Gaurav and Patel 2020</xref> and <xref ref-type="bibr" rid="B38">Slob <italic>et al.</italic> 2021</xref>). Automatic learning is good, for example, in problems that require many rules, fluctuating environments, and in problems that require discovering insights in large amounts of data.</p>
			<p>
				<xref ref-type="bibr" rid="B17">Géron (2019)</xref> proposes three main ML systems: those that are supervised during training, those that can learn incrementally on the course, and those that allow comparing new data points with known data points. Automatic learning systems can classify data based on the training data used to learn the model. This opens up several categories, but this study is driven by supervised learning, which requires the solutions in the training data, commonly called labels. An example of this learning is the classification of <italic>spam</italic> emails (<xref ref-type="bibr" rid="B44">Valdez 2019</xref>).</p>
			<p>For <xref ref-type="bibr" rid="B2">Alwadi <italic>et al.</italic> (2024)</xref>, the gradient boosting classifier (GBC) uses large data sets to develop models that forecast production and find relevant patterns. This method, used in a study in Jordan, where sensors were used to track 4,000 cows, showed great potential for increasing productivity. Similarly, <xref ref-type="bibr" rid="B3">Bai <italic>et al.</italic> (2022)</xref> showed that GBDT-AdaBoost achieved an average recognition accuracy of 98.0 %, exceeding other models such as the random forest and extremely random tree, which had accuracies of 79.9 % and 71.1 %, respectively.</p>
			<p>
				<xref ref-type="bibr" rid="B6">Bovo <italic>et al.</italic> (2021)</xref> showed a random forest (RF) classifier with an average prediction error of 18 % for daily milk production of each cow, and only 2 % for total production. This shows that the random forest classifier is effective in calibrating models that help improve sustainability and efficiency in dairy livestock.</p>
			<p>
				<xref ref-type="bibr" rid="B31">Piwczyński <italic>et al</italic>. (2020)</xref> used a decision tree (DT) classifier to identify factors that influence on high monthly milk production in Holstein-Friesian cows in 27 herds with milking robots. The results showed that the highest monthly production (47.24 kg) was recorded in multiparous cows, milked more than three times a day, in stables with deep bedding. In contrast, the lowest production (13.56 kg) was observed in cows milked less than twice a day, with an average of less than 3.97 quarters milked. This model allows breeders to fit factors to maximize milk production.</p>
			<p>Finally, <xref ref-type="bibr" rid="B9">Fadillah <italic>et al.</italic> (2023)</xref> in a study with Indonesian dairy farmers on milk quality and factors associated with total plate count (TPC) and somatic cell count (SCC). Multinomial regression models and Firth-type logistic regression were used to identify factors related to the knowledge of TPC and SCC. They identified as significant variables belonging to cooperatives, distance from neighboring farmers and the adoption of technology to increase awareness about milk quality among small farmers. In general, such results provide evidence that these are models applicable to any region and facilitate decision-making based on results with effective measurements.</p>
			<p>This research compared four different automatic learning techniques: gradient boosting classifier (GBC), random forest classifier (RF), decision tree classifier (DT), and logistic regression (LR). The results showed that GBC and RF were the most effective automatic learning techniques for classifying milk production.</p>
		</sec>
		<sec sec-type="methods">
			<title>Methodology</title>
			<p>This study involves an experimental analysis consisting of four phases: data preprocessing, feature selection, classification, and comparative analysis of the classifiers. The workflow of the proposed methodology is shown in <xref ref-type="fig" rid="f1">figure 1</xref>, which illustrates the relations between the different phases and the application of specific algorithms at each stage.</p>
			<p>
				<fig id="f1">
					<label>Figure 1</label>
					<caption>
						<title>Workflow for predicting small-scale dairy production</title>
					</caption>
					<graphic xlink:href="2079-3480-cjas-59-e01-gf1.svg"/>
					<attrib>Source: Own elaboration</attrib>
				</fig>
			</p>
			<sec>
				<title>Data collection</title>
				<p>The population of small and medium dairy farmers from Carchi province was surveyed, totaling 532 individuals. An applied research approach was used with an exploratory and correlational methodology (<xref ref-type="bibr" rid="B19">Hernández-Sampieri and Mendoza 2018</xref>). The questionnaire deal with a variety of factors, providing information on relevant aspects to the dairy farming community:</p>
				<p>
					<list list-type="bullet">
						<list-item>
							<p><bold>Social</bold>: age, gender, educational level, family structure, training, access to technology, housing conditions, basic services, employment, associativity, governance and participation, government technical support</p>
						</list-item>
						<list-item>
							<p><bold>Economic</bold>: livestock incomes, other incomes, production costs, income distribution, financing, marketing, farm size.</p>
						</list-item>
						<list-item>
							<p><bold>Productive</bold>: land use, herd size and structure, number of heads of cattle, grasses, milk production per hectare (L ha<sup>-1</sup>), adoption of technology and productive diversification. number of heads of cattle.</p>
						</list-item>
					</list>
				</p>
				<p>A total of 17 questions with quantitative information, 23 interval questions and 10 dichotomous questions were incorporated. The questionnaire was rigorously developed and its content and structure were validated. Field data collection was carried out in collaboration with Business Administration students from the Universidad Politécnica Estatal del Carchi (UPEC), Ecuador, during the second semester of 2022. Simple random sampling was applied.</p>
			</sec>
			<sec>
				<title>Data preprocessing</title>
				<p>The collected data were subjected to a rigorous preprocessing process, which included the removal of errors and outliers, as well as the treatment of missing values. Min-Max normalization was applied to ensure that all features had a common range and were comparable to each other (<xref ref-type="bibr" rid="B43">Treviño Cantú 2022</xref>). This allowed eliminating any bias due to the data scale, ensuring a more accurate and fairing analysis.</p>
			</sec>
			<sec>
				<title>Feature Selection</title>
				<p>Function selection plays an important role in the data preprocessing phase before applying automatic learning techniques (<xref ref-type="bibr" rid="B37">Siddiqui and Amer 2024</xref>). It involves selecting the most relevant and informative features from the data set, while discarding irrelevant or redundant features. In this study, feature selection was used to improve the yield and interpretability of automatic learning models to classify small-scale dairy farmers in the border region between Ecuador and Colombia.</p>
				<p>The dataset used in this research contains several socioeconomic and production-related variables that could potentially influence on milk production. However, not all of these variables are equally important for the prediction task. Some features may introduce noise, increase computational upload, or cause an overfitting, which make difficult the model's ability to generalize well unseen data.</p>
				<p>To deal with these challenges and identify the most influential features, recursive feature elimination (RFE) technique was used. It is a popular and powerful feature selection method that works by recursively fitting the automatic learning model, removing the least significant features in each iteration. The process continues until the desired number of features is obtained. The importance of RFE lies in its ability to rank features based on their contribution to the model yield, allowing to focus on the most relevant attributes and discard the less informative ones (<xref ref-type="bibr" rid="B24">Mannepalli <italic>et al</italic>. 2024</xref>).</p>
				<p>The initial database consisted of 134 items, including numerical, dichotomous and categorical variables. In order to reduce the dimensionality of the data and the computational cost during model training, feature selection was applied and finally the set was reduced to 10 variables. The type of house, access to drinking water and electricity, marketing of raw milk, sales of pasteurized cheese, use of milk for cheese production, customer relations, total annual income from primary activity, liters used for cheese production and price per liter were included.</p>
			</sec>
			<sec>
				<title>Classification algorithm</title>
				<sec>
					<title>Gradient Boosting Classifier (GBC)</title>
					<p>Is a classifier that highlights for its accuracy and prediction speed on large and complex data sets. It also minimizes the bias error of the model (<xref ref-type="bibr" rid="B5">Bentéjac <italic>et al.</italic> 2020</xref>). This method is used when there are only two classes in the target features, i.e. binary classes (positive and negative). The loss function as log-likelihood is used in the creation (training) of the model (<xref ref-type="bibr" rid="B28">Natekin and Knoll 2013</xref>). This loss is shown in <xref ref-type="disp-formula" rid="e1">equation (1)</xref>:</p>
					<p>
						<disp-formula id="e1">
							<mml:math>
								<mml:mrow>
									<mml:mi>L</mml:mi>
									<mml:mfenced>
										<mml:mi>θ</mml:mi>
									</mml:mfenced>
									<mml:mo>=</mml:mo>
									<mml:mo>−</mml:mo>
									<mml:mo>∑</mml:mo>
									<mml:msub>
										<mml:mi>y</mml:mi>
										<mml:mi>i</mml:mi>
									</mml:msub>
									<mml:mi>log</mml:mi>
									<mml:mo stretchy="false">(</mml:mo>
									<mml:mi>p</mml:mi>
									<mml:mo stretchy="false">(</mml:mo>
									<mml:msub>
										<mml:mi>y</mml:mi>
										<mml:mi>i</mml:mi>
									</mml:msub>
									<mml:mo>|</mml:mo>
									<mml:msub>
										<mml:mi>x</mml:mi>
										<mml:mi>i</mml:mi>
									</mml:msub>
									<mml:mo>;</mml:mo>
									<mml:mi>θ</mml:mi>
									<mml:mo stretchy="false">)</mml:mo>
									<mml:mo stretchy="false">)</mml:mo>
								</mml:mrow>
							</mml:math>
							<label>(1)</label>
						</disp-formula>
					</p>
					<p>where <mml:math>
							<mml:mrow>
								<mml:msub>
									<mml:mi>y</mml:mi>
									<mml:mi>i</mml:mi>
								</mml:msub>
							</mml:mrow>
						</mml:math> is the classification target, <mml:math>
							<mml:mi>p</mml:mi>
						</mml:math> is the predicted probability of class 1, and θ is the input.</p>
					<p>The loss function finds the residuals after creating the decision tree with all the independent variables and the target. When the first tree is built, the final output is by the leaves (<xref ref-type="bibr" rid="B36">Saini 2021</xref>). The direct formula to calculate the final result is shown in <xref ref-type="disp-formula" rid="e2">equation (2)</xref>:</p>
					<p>
						<disp-formula id="e2">
							<mml:math>
								<mml:mrow>
									<mml:mstyle mathsize="normal" mathvariant="bold">
										<mml:mi>γ</mml:mi>
									</mml:mstyle>
									<mml:mo>=</mml:mo>
									<mml:mfrac>
										<mml:mrow>
											<mml:msubsup>
												<mml:mstyle displaystyle="true" mathsize="140%">
													<mml:mo>∑</mml:mo>
												</mml:mstyle>
												<mml:mrow>
													<mml:mi>i</mml:mi>
													<mml:mo>=</mml:mo>
													<mml:mn>1</mml:mn>
												</mml:mrow>
												<mml:mi>n</mml:mi>
											</mml:msubsup>
											<mml:mi>R</mml:mi>
											<mml:mi>e</mml:mi>
											<mml:mi>s</mml:mi>
											<mml:mi>i</mml:mi>
											<mml:mi>d</mml:mi>
											<mml:mi>u</mml:mi>
											<mml:mi>a</mml:mi>
											<mml:msub>
												<mml:mi>l</mml:mi>
												<mml:mi>i</mml:mi>
											</mml:msub>
										</mml:mrow>
										<mml:mrow>
											<mml:msubsup>
												<mml:mstyle displaystyle="true" mathsize="140%">
													<mml:mo>∑</mml:mo>
												</mml:mstyle>
												<mml:mrow>
													<mml:mi>i</mml:mi>
													<mml:mo>=</mml:mo>
													<mml:mn>1</mml:mn>
												</mml:mrow>
												<mml:mi>n</mml:mi>
											</mml:msubsup>
											<mml:mfenced close="]" open="[">
												<mml:mrow>
													<mml:mi>P</mml:mi>
													<mml:mi>r</mml:mi>
													<mml:mi>e</mml:mi>
													<mml:mi>v</mml:mi>
													<mml:mi>i</mml:mi>
													<mml:mi>o</mml:mi>
													<mml:mi>u</mml:mi>
													<mml:mi>s</mml:mi>
													<mml:mo> </mml:mo>
													<mml:mi>p</mml:mi>
													<mml:mi>r</mml:mi>
													<mml:mi>o</mml:mi>
													<mml:mi>b</mml:mi>
													<mml:mi>a</mml:mi>
													<mml:mi>b</mml:mi>
													<mml:mi>i</mml:mi>
													<mml:mi>l</mml:mi>
													<mml:mi>i</mml:mi>
													<mml:mi>t</mml:mi>
													<mml:msub>
														<mml:mi>y</mml:mi>
														<mml:mi>i</mml:mi>
													</mml:msub>
													<mml:mo>×</mml:mo>
													<mml:mfenced>
														<mml:mrow>
															<mml:mn>1</mml:mn>
															<mml:mo>−</mml:mo>
															<mml:mi>P</mml:mi>
															<mml:mi>r</mml:mi>
															<mml:mi>e</mml:mi>
															<mml:mi>v</mml:mi>
															<mml:mi>i</mml:mi>
															<mml:mi>o</mml:mi>
															<mml:mi>u</mml:mi>
															<mml:mi>s</mml:mi>
															<mml:mo> </mml:mo>
															<mml:mi>p</mml:mi>
															<mml:mi>r</mml:mi>
															<mml:mi>o</mml:mi>
															<mml:mi>b</mml:mi>
															<mml:mi>a</mml:mi>
															<mml:mi>b</mml:mi>
															<mml:mi>i</mml:mi>
															<mml:mi>l</mml:mi>
															<mml:mi>i</mml:mi>
															<mml:mi>t</mml:mi>
															<mml:msub>
																<mml:mi>y</mml:mi>
																<mml:mi>i</mml:mi>
															</mml:msub>
														</mml:mrow>
													</mml:mfenced>
												</mml:mrow>
											</mml:mfenced>
										</mml:mrow>
									</mml:mfrac>
								</mml:mrow>
							</mml:math>
							<label>(2)</label>
						</disp-formula>
					</p>
					<p>where <mml:math>
							<mml:mi>Y</mml:mi>
						</mml:math> is the objective function for the classification decisión. </p>
				</sec>
				<sec>
					<title>Random Forest classifier (RF)</title>
					<p>It is called a decision tree forest. This method is based on the principle of bagging with random feature selection and the model uses voting to combine tree predictions. RF works well for most of the problems; it can manage noise and select only the most important features. However, the interpretability of the model is limited and its fitting requires some effort in data management (<xref ref-type="bibr" rid="B16">Gaurav and Patel 2020</xref>).</p>
				</sec>
				<sec>
					<title>Decision Tree classifier (DT)</title>
					<p>It is a supervised automatic learning algorithm that can be used for categorization or prediction. The DTs are designed to mimic human thinking, making the results easy to understand and interpret. The six key components of a DT are the root node, split, decision node, leaf node, pruning and branch (<xref ref-type="bibr" rid="B39">Suthaharan 2016</xref>).</p>
					<p>The DTs are used in problems which involve data and variables, both numerical and categorical.</p>
					<p>They are effective for modeling problems with multiple results and for testing the reliability of trees. Another advantage of DTs is that they require less data cleaning compared to other data modeling techniques. However, it is important to recognize that DTs can be affected by noise and may not be ideal for larger datasets (<xref ref-type="bibr" rid="B23">Kliś <italic>et al.</italic> 2021</xref>).</p>
				</sec>
				<sec>
					<title>Logistic regression (LR)</title>
					<p>Also called logit regression, is used to estimate the probability that an instance belongs to a given class. Typically, it is used for binary classification tasks where classes are labeled as 0 and 1, according to a probability threshold (<xref ref-type="bibr" rid="B17">Géron 2019</xref>). The estimated probability of LR is showed in <xref ref-type="disp-formula" rid="e3">equation (3)</xref>:</p>
					<p>
						<disp-formula id="e3">
							<mml:math>
								<mml:mrow>
									<mml:mover accent="true">
										<mml:mi>p</mml:mi>
										<mml:mo>^</mml:mo>
									</mml:mover>
									<mml:mo>=</mml:mo>
									<mml:msub>
										<mml:mi>h</mml:mi>
										<mml:mi>θ</mml:mi>
									</mml:msub>
									<mml:mfenced>
										<mml:mstyle mathsize="normal" mathvariant="bold">
											<mml:mi>x</mml:mi>
										</mml:mstyle>
									</mml:mfenced>
									<mml:mo>=</mml:mo>
									<mml:mstyle mathsize="normal" mathvariant="bold">
										<mml:mi>σ</mml:mi>
									</mml:mstyle>
									<mml:mfenced>
										<mml:mrow>
											<mml:msup>
												<mml:mi>θ</mml:mi>
												<mml:mi>t</mml:mi>
											</mml:msup>
											<mml:mi>⋅</mml:mi>
											<mml:mstyle mathsize="normal" mathvariant="bold">
												<mml:mi>x</mml:mi>
											</mml:mstyle>
										</mml:mrow>
									</mml:mfenced>
								</mml:mrow>
							</mml:math>
							<label>(3)</label>
						</disp-formula>
					</p>
					<p>where σ (t) is a sigmoid function that produces a number between 0 and 1, given by the logistic function shown in <xref ref-type="disp-formula" rid="e4">equation (4)</xref>:</p>
					<p>
						<disp-formula id="e4">
							<mml:math>
								<mml:mrow>
									<mml:mstyle mathsize="normal" mathvariant="bold">
										<mml:mi>σ</mml:mi>
									</mml:mstyle>
									<mml:mfenced>
										<mml:mstyle mathsize="normal" mathvariant="bold">
											<mml:mi>t</mml:mi>
										</mml:mstyle>
									</mml:mfenced>
									<mml:mo>=</mml:mo>
									<mml:mfrac>
										<mml:mn>1</mml:mn>
										<mml:mrow>
											<mml:mn>1</mml:mn>
											<mml:mo>+</mml:mo>
											<mml:msup>
												<mml:mi>e</mml:mi>
												<mml:mrow>
													<mml:mo>−</mml:mo>
													<mml:mi>t</mml:mi>
												</mml:mrow>
											</mml:msup>
										</mml:mrow>
									</mml:mfrac>
								</mml:mrow>
							</mml:math>
							<label>(4)</label>
						</disp-formula>
					</p>
					<p>where <mml:math>
							<mml:mi>t</mml:mi>
						</mml:math> is the time</p>
					<p>The evaluation of automatic learning models is described below:</p>
					<p>
						<list list-type="bullet">
							<list-item>
								<p><italic>Accuracy or Proximity of results</italic>: It uses the parameters true positive (TP), true negative (TN), false positive (FP), false negative (FN).</p>
							</list-item>
							<list-item>
								<p><italic>Area under the curve (AUC):</italic> It measures the ability of the model to discriminate between two classes. </p>
							</list-item>
							<list-item>
								<p><italic>Recall or probability of classifying true positives:</italic> It uses the parameters true positive (TP), false negative (FN).</p>
							</list-item>
							<list-item>
								<p><italic>Precision or dispersion of the set of values ​​obtained:</italic> Uses the parameters true positive (TP) and false positive (FP).</p>
							</list-item>
							<list-item>
								<p><italic>F1 (F-Score):</italic> Combines precision and recall measures into a single value.</p>
							</list-item>
							<list-item>
								<p><italic>Kappa</italic> quantifies the agreement between predictions made by a model and the true classes. It is used to evaluate the different predictive yield between classes.</p>
							</list-item>
							<list-item>
								<p>Training Time (TT Sec) measures the time it takes for a model to learn from the training dataset and fit its parameters to obtain accurate predictions.</p>
							</list-item>
						</list>
					</p>
				</sec>
			</sec>
		</sec>
		<sec sec-type="results|discussion">
			<title>Results and Discussion</title>
			<p>Automatic learning algorithm preparation, including feature selection and model training, was performed using a combination of state-of-the-art data science tools. The code used for this purpose, based on the 'pycaret' and 'scikit-learn' libraries in Python, formed the cornerstone of the methodological approach.</p>
			<p>Implementing the model using standard 'scikit-learn' functions provided a solid foundation for the training process. In this study, hyperparameter fitting was intentionally omitted, relying instead on the default parameters inherent to each model. This strategic choice was made to maintain methodological consistency and facilitate direct comparisons between models. The adoption of default settings inherent to each algorithm was intended to maintain a standardized framework across all analyses, ensuring transparency and reproducibility of the experiments.</p>
			<p>The best model trained with the dataset discussed above was GBC, which achieved 96.77 % correct predictions in the testing phase. Additionally, the percentage of the predictive evaluation ability of the trained model was 96.9 %, and in the performance evaluation it reached 93.50 %. Other important metrics such as AUC, recall and precision were also measured, which scored 99.4, 97.90 and 96.10 % respectively. Also, metrics for models such as RF, DT and LR are showed in <xref ref-type="table" rid="t1">table 1</xref>.</p>
			<p>
				<table-wrap id="t1">
					<label>Table 1</label>
					<caption>
						<title>Results of classification algorithms</title>
					</caption>
					<table>
						<colgroup>
							<col/>
							<col/>
							<col/>
							<col/>
							<col/>
							<col/>
							<col/>
							<col/>
						</colgroup>
						<thead>
							<tr>
								<th align="left">Algorithm</th>
								<th align="center">Accuracy, %</th>
								<th align="center">AUC, %</th>
								<th align="center">Recall, %</th>
								<th align="center">Prec, %</th>
								<th align="center">F1, %</th>
								<th align="center">Kappa, %</th>
								<th align="center">TT, seg.</th>
							</tr>
						</thead>
						<tbody>
							<tr>
								<td align="left">GBC</td>
								<td align="center">0.9677</td>
								<td align="center">0.994</td>
								<td align="center">0,979</td>
								<td align="center">0.961</td>
								<td align="center">0.969</td>
								<td align="center">0.935</td>
								<td align="center">0.90</td>
							</tr>
							<tr>
								<td align="left">RF</td>
								<td align="center">0.9518</td>
								<td align="center">0.984</td>
								<td align="center">0.964</td>
								<td align="center">0.946</td>
								<td align="center">0.954</td>
								<td align="center">0.903</td>
								<td align="center">1.00</td>
							</tr>
							<tr>
								<td align="left">DT</td>
								<td align="center">0.9489</td>
								<td align="center">0.956</td>
								<td align="center">0.943</td>
								<td align="center">0.96</td>
								<td align="center">0.95</td>
								<td align="center">0.898</td>
								<td align="center">0.63</td>
							</tr>
							<tr>
								<td align="left">LR</td>
								<td align="center">0.9141</td>
								<td align="center">0.977</td>
								<td align="center">0.948</td>
								<td align="center">0.894</td>
								<td align="center">0.919</td>
								<td align="center">0.828</td>
								<td align="center">0.77</td>
							</tr>
						</tbody>
					</table>
				</table-wrap>
			</p>
			<p>In this study, the training time of the models was measured. In GBC, the training took approximately 0.9 seconds. RF, DT and LR achieved 1, 0.63 and 0.77 seconds in their training respectively. These results and the accuracy of each model are shown in <xref ref-type="fig" rid="f2">figure 2</xref>.</p>
			<p>
				<fig id="f2">
					<label>Figure 2</label>
					<caption>
						<title>Accuracy and execution time of the top-rated automatic learning algorithms</title>
					</caption>
					<graphic xlink:href="2079-3480-cjas-59-e01-gf2.svg"/>
				</fig>
			</p>
			<p>An essential phase in forming the best model was feature importance. The GBC model, which is the best, found that the feature corresponding to “main income” had a metric of 80 %. The feature importances are showed in <xref ref-type="fig" rid="f3">figure 3</xref>.</p>
			<p>
				<fig id="f3">
					<label>Figure 3</label>
					<caption>
						<title>Important features of the GBC model</title>
					</caption>
					<graphic xlink:href="2079-3480-cjas-59-e01-gf3.svg"/>
				</fig>
			</p>
			<p>
				<xref ref-type="fig" rid="f4">Figure 4</xref> shows the prediction matrix and the top left and bottom right boxes correspond to correct predictions, while the top right and bottom left boxes contain incorrect predictions or false positives.</p>
			<p>
				<fig id="f4">
					<label>Figure 4</label>
					<caption>
						<title>Confusion matrix of the best classification model.</title>
					</caption>
					<graphic xlink:href="2079-3480-cjas-59-e01-gf4.svg"/>
				</fig>
			</p>
			<p>
				<xref ref-type="bibr" rid="B29">Nyambo et al. (2023)</xref> applied automatic learning techniques (ML) in the dairy industry from Tanzania. Their study focused on three main issues: inadequate infrastructure, outdated technology and low productivity. They analyzed the data and found homogeneous production groups. Then they made recommendations to increase milk production. Similarly, <xref ref-type="bibr" rid="B27">Mwanga <italic>et al.</italic> (2020)</xref> used ML to identify groups of farmers. In their case, the classification was based on the farm location. It was also based on the system of feeding and caring of animals. This information facilitated better planning and resource management. It allowed for more precise interventions in each group to improve services.</p>
			<p>Authors such as <xref ref-type="bibr" rid="B1">Abdukarimova <italic>et al.</italic> (2016)</xref> mention that estimating milk production helps to assess production performance and it is necessary for efficient resource management. However, there are several challenges associated with milk production prediction, especially in effective classification.</p>
			<p>
				<xref ref-type="bibr" rid="B21">Ji <italic>et al.</italic> (2022)</xref> ran an automatic learning framework using five years of productivity and behavioral health data from 80 cows. They achieved an accuracy of over 80 %.</p>
			<p>Other authors such as <xref ref-type="bibr" rid="B34">Radwan <italic>et al.</italic> (2020)</xref> have proposed a dynamic linear model (DLM) and an artificial neural network (ANN) in the prediction of milk production. The DLM achieved 95 % accuracy using a dataset consisting of 1,094,780 observations of sensor data provided by Lely Industries (Masslui, The Netherlands). The ANN achieved 79.5 % accuracy, exceeding milk production expectations.</p>
			<p>Despite the challenges involved, this study compared different automatic learning models (GBC, RF, DT, LR) on a milk production dataset from Carchi, Ecuador province. The results showed significant classification accuracy: GBC achieved 96.77 % precision and 97.9 % recall. RF achieved 95.18 % accuracy and 95.4 % F1 score.</p>
			<p>The abundance of data in the livestock sector requires innovative analytical approaches. This study researched the potential of deep learning models, specifically six neural network algorithms, as an alternative to traditional statistical methods. Compared to these traditional methods, deep learning models can achieve higher accuracy, making them valuable tools for identifying agricultural variables and developing safe dairy products and risk management practices (<xref ref-type="bibr" rid="B40">Suseendran and Duraisamy 2021</xref>).</p>
			<p>The researchers used classification methods to identify relevant variables, and then used these variables to train several predictive models. These models included not only deep learning algorithms but also established ones such as logistic regression, k nearest neighbors, decision trees, and random forests. While most models achieved high predictive yield of 93 %, neural networks and Gaussian mixture models proved to be more sensitive to variations in the dataset. In response, researchers combined random forest and decision tree algorithms to improve factor selection (<xref ref-type="bibr" rid="B27">Mwanga <italic>et al.</italic> 2020</xref>).</p>
			<p>The survey results showed that the main economic income derived from milk production (89 %), the price per liter of milk (46 %) and the amount of liters of milk used for cheese production (18 %) were the most important factors in the production. The presence of a child as the economic support of the house (5 %), the use of milk for the production and sale of cheese (21 %) and the use of milk and cheese production for domestic consumption (53 %) also had a significant impact, but to a lesser extent.</p>
			<p>The study describes the key SEFs that shape family dynamics and agricultural production in the studied community. It is noted that 90 % of farmers who maintain adequate home conditions, the educational level does not show any influence on family welfare decisions. However, the university education level of some farmers shows the presence of higher incomes and better production rates. In addition, a patriarchal model of family breadwinner prevails, in which husbands assuming this role in 75 % of houses. Age also emerges as a factor. There was increase in cohabitation between the ages of 50 and 55. Also, the experience is intertwined with education, as both have a significant impact on production levels. These findings underscore the complex interplay between education, income, house structure and agricultural productivity and provide valuable information for developing socioeconomic models and development strategies.</p>
			<p>The study suggests further exploration through an analysis of technical production efficiency, which would include variables such as infrastructure, labor, products management, milking processes, management, environmental practices and quality control. This type of analysis would allow optimizing production capacities in a production unit. This can lead to specific interventions to improve production efficiency, facilitate fair market access and rationalize value-added dairy processing activities.</p>
		</sec>
		<sec sec-type="conclusions">
			<title>Conclusions</title>
			<p>This study has identified the factors that influence on production in small dairy farms in the border region between Ecuador and Colombia. The results of this study can be used to inform future researchers and decisions aimed at supporting the sustainability and development of the dairy sector in the region. By shedding light on the key determinants of milk production and its impact on the economic well-being of rural families, this research provides a valuable guidance to stakeholders and policy makers in formulating targeted interventions and initiatives.</p>
			<p>This study, in the unique context of the Ecuadorian border region, highlights the potential of automatic learning techniques to accurately classify small farmers’ milk production. The successful application of automatic learning algorithms including Gradient Boosting Classifier and Random Forest has proven effective in classifying milk production with remarkable accuracy.</p>
			<p>The results of this study have significant implications for the dairy industry in the Ecuador-Colombia border region, and beyond. The identified factors which influence on milk production provide a roadmap for improving productivity and livelihoods in small-scale dairy farming communities.</p>
			<p>As the dairy sector continues to play an essential role in the region’s economy, harnessing the power of automatic learning to identify relevant variables will be critical to shaping predictive models, promoting sustainable growth, and strengthening the sector’s overall economic well-being.</p>
		</sec>
	</body>
	<back>
		<ref-list>
			<title>References</title>
			<ref id="B1">
				<mixed-citation>Abdukarimova, M., Abdukarimov, A. &amp; Abdukarimov, N. 2016. <italic>Handbook of Industrial and Innovation Economics</italic>, editado por Munisa, 466p. Uzbekistan: Independently. ISBN: 979-8412353852. Available at: <ext-link ext-link-type="uri" xlink:href="https://www.researchgate.net/profile/Munisa-Abdukarimova/publication/344279960_Handbook_of_Industrial_and_innovation_economics/links/62493f3621077329f2ed6414/Handbook-of-Industrial-and-innovation-economics.pdf">https://www.researchgate.net/profile/Munisa-Abdukarimova/publication/344279960_Handbook_of_Industrial_and_innovation_economics/links/62493f3621077329f2ed6414/Handbook-of-Industrial-and-innovation-economics.pdf</ext-link>. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Abdukarimova</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Abdukarimov</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Abdukarimov</surname>
							<given-names>N.</given-names>
						</name>
					</person-group>
					<year>2016</year>
					<source>Handbook of Industrial and Innovation Economics</source>
					<person-group person-group-type="editor">
						<collab>Munisa</collab>
					</person-group>
					<size units="pages">466</size>
					<publisher-loc>Uzbekistan</publisher-loc>
					<publisher-name>Independently</publisher-name>
					<isbn>979-8412353852</isbn>
					<ext-link ext-link-type="uri" xlink:href="https://www.researchgate.net/profile/Munisa-Abdukarimova/publication/344279960_Handbook_of_Industrial_and_innovation_economics/links/62493f3621077329f2ed6414/Handbook-of-Industrial-and-innovation-economics.pdf.">https://www.researchgate.net/profile/Munisa-Abdukarimova/publication/344279960_Handbook_of_Industrial_and_innovation_economics/links/62493f3621077329f2ed6414/Handbook-of-Industrial-and-innovation-economics.pdf.</ext-link>
				</element-citation>
			</ref>
			<ref id="B2">
				<mixed-citation>Alwadi, M., Alwadi, A., Chetty, G. &amp; Alnaimi, J. 2024. Smart dairy farming for predicting milk production yield based on deep machine learning. <italic>International Journal of Information Technology</italic>, 16: 4181-4190, ISSN: 2511-2112. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s41870-024-01998-5">https://doi.org/10.1007/s41870-024-01998-5</ext-link>.</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Alwadi</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Alwadi</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Chetty</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Alnaimi</surname>
							<given-names>J</given-names>
						</name>
					</person-group>
					<year>2024</year>
					<article-title>Smart dairy farming for predicting milk production yield based on deep machine learning</article-title>
					<source>International Journal of Information Technology</source>
					<volume>16</volume>
					<fpage>4181</fpage>
					<lpage>4190</lpage>
					<issn>2511-2112</issn>
					<pub-id pub-id-type="doi">10.1007/s41870-024-01998-5</pub-id>
				</element-citation>
			</ref>
			<ref id="B3">
				<mixed-citation>Bai, J., Xue, H., Jiang, X. &amp; Zhou, Y. 2022. Recognition of bovine milk somatic cells based on multi-feature extraction and a GBDT-AdaBoost fusion model. <italic>Mathematical Biosciences and Engineering: MBE</italic>, 19(6): 5850-5866, ISSN: 1551-0018. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3934/mbe.2022274">https://doi.org/10.3934/mbe.2022274</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Bai</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Xue</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Jiang</surname>
							<given-names>X.</given-names>
						</name>
						<name>
							<surname>Zhou</surname>
							<given-names>Y.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>Recognition of bovine milk somatic cells based on multi-feature extraction and a GBDT-AdaBoost fusion model</article-title>
					<source>Mathematical Biosciences and Engineering: MBE</source>
					<volume>19</volume>
					<issue>6</issue>
					<fpage>5850</fpage>
					<lpage>5866</lpage>
					<issn>1551-0018</issn>
					<pub-id pub-id-type="doi">10.3934/mbe.2022274</pub-id>
				</element-citation>
			</ref>
			<ref id="B4">
				<mixed-citation>Balarezo, L., García-D, J., Hernández, M. &amp; García-L, R. 2016. Metabolic and reproductive state of Holstein cattle in the Carchi region, Ecuador. <italic>Cuban Journal of Agricultural Science</italic>, 50(3): 381-392, ISSN: 2079-3480. <ext-link ext-link-type="uri" xlink:href="https://cjascience.com/index.php/CJAS/article/view/632/699">https://cjascience.com/index.php/CJAS/article/view/632/699</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Balarezo</surname>
							<given-names>L.</given-names>
						</name>
						<name>
							<surname>García-D</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Hernández</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>García-L</surname>
							<given-names>R.</given-names>
						</name>
					</person-group>
					<year>2016</year>
					<article-title>Metabolic and reproductive state of Holstein cattle in the Carchi region, Ecuador</article-title>
					<source>Cuban Journal of Agricultural Science</source>
					<volume>50</volume>
					<issue>3</issue>
					<fpage>381</fpage>
					<lpage>392</lpage>
					<issn>2079-3480</issn>
					<ext-link ext-link-type="uri" xlink:href="https://cjascience.com/index.php/CJAS/article/view/632/699">https://cjascience.com/index.php/CJAS/article/view/632/699</ext-link>
				</element-citation>
			</ref>
			<ref id="B5">
				<mixed-citation>Bentéjac, C., Csörgő, A. &amp; Martínez-Muñoz, G. 2020. A comparative analysis of gradient boosting algorithms. <italic>Artificial Intelligence Review</italic>, 54(3): 1937-1967, ISSN: 1573-7462. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s10462-020-09896-5">https://doi.org/10.1007/s10462-020-09896-5</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Bentéjac</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Csörgő</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Martínez-Muñoz</surname>
							<given-names>G.</given-names>
						</name>
					</person-group>
					<year>2020</year>
					<article-title>A comparative analysis of gradient boosting algorithms</article-title>
					<source>Artificial Intelligence Review</source>
					<volume>54</volume>
					<issue>3</issue>
					<fpage>1937</fpage>
					<lpage>1967</lpage>
					<issn>1573-7462</issn>
					<pub-id pub-id-type="doi">10.1007/s10462-020-09896-5</pub-id>
				</element-citation>
			</ref>
			<ref id="B6">
				<mixed-citation>Bovo, M., Agrusti, M., Benni, S., Torreggiani, D, &amp; Tassinari P. 2021. Random Forest Modelling of Milk Yield of Dairy Cows under Heat Stress Conditions. <italic>Animals</italic>, 11(5): 1305, ISSN: 2076-2615. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3390/ani11051305">https://doi.org/10.3390/ani11051305</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Bovo</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Agrusti</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Benni</surname>
							<given-names>S.</given-names>
						</name>
						<name>
							<surname>Torreggiani</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Tassinari</surname>
							<given-names>P.</given-names>
						</name>
					</person-group>
					<year>2021</year>
					<article-title>Random Forest Modelling of Milk Yield of Dairy Cows under Heat Stress Conditions</article-title>
					<source>Animals</source>
					<volume>11</volume>
					<issue>5</issue>
					<fpage>1305</fpage>
					<lpage>1305</lpage>
					<issn>2076-2615</issn>
					<pub-id pub-id-type="doi">10.3390/ani11051305</pub-id>
				</element-citation>
			</ref>
			<ref id="B7">
				<mixed-citation>Carvajal, L.A. 2014. La asociatividad en el sector agropecuario del Carchi y su potencial de producir y comercializar semielaborados de papa y leche. <italic>SATHIRI</italic>, 7(7): 153-163, ISSN: 2631-2905. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.32645/13906925.348">https://doi.org/10.32645/13906925.348</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Carvajal</surname>
							<given-names>L.A.</given-names>
						</name>
					</person-group>
					<year>2014</year>
					<article-title>La asociatividad en el sector agropecuario del Carchi y su potencial de producir y comercializar semielaborados de papa y leche</article-title>
					<source>SATHIRI</source>
					<volume>7</volume>
					<issue>7</issue>
					<fpage>153</fpage>
					<lpage>163</lpage>
					<issn>2631-2905</issn>
					<pub-id pub-id-type="doi">10.32645/13906925.348</pub-id>
				</element-citation>
			</ref>
			<ref id="B8">
				<mixed-citation>CIL Ecuador. 2023. <italic>La industria láctea fomenta la economía circular, a través de una producción sostenible,</italic> Comprometidos con el Desarrollo de la Cadena Láctea. Available at: <ext-link ext-link-type="uri" xlink:href="https://www.cil-ecuador.org/post/la-industria-láctea-fomenta-la-economía-circular-a-través-de-una-producción-sostenible">https://www.cil-ecuador.org/post/la-industria-láctea-fomenta-la-economía-circular-a-través-de-una-producción-sostenible</ext-link>. [Consulted: March 10, 2024]. </mixed-citation>
				<element-citation publication-type="webpage">
					<source>CIL Ecuador</source>
					<year>2023</year>
					<article-title>La industria láctea fomenta la economía circular, a través de una producción sostenible, Comprometidos con el Desarrollo de la Cadena Láctea</article-title>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://www.cil-ecuador.org/post/la-industria-láctea-fomenta-la-economía-circular-a-través-de-una-producción-sostenible">https://www.cil-ecuador.org/post/la-industria-láctea-fomenta-la-economía-circular-a-través-de-una-producción-sostenible</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-03-10">March 10, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B9">
				<mixed-citation>Fadillah, A., van den Borne, B.H.P., Poetri, O.N., Hogeveen, H., Umberger, W., Hetherington, J., &amp; Schukken, Y.H. 2023. Smallholder milk-quality awareness in Indonesian dairy farms. <italic>Journal of Dairy Science</italic>, 106(11): 7965-7973, ISSN: 0022-0302. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3168/JDS.2023-23267">https://doi.org/10.3168/JDS.2023-23267</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Fadillah</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>van den Borne</surname>
							<given-names>B.H.P.</given-names>
						</name>
						<name>
							<surname>Poetri</surname>
							<given-names>O.N.</given-names>
						</name>
						<name>
							<surname>Hogeveen</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Umberger</surname>
							<given-names>W.</given-names>
						</name>
						<name>
							<surname>Hetherington</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Schukken</surname>
							<given-names>Y.H.</given-names>
						</name>
					</person-group>
					<year>2023</year>
					<article-title>Smallholder milk-quality awareness in Indonesian dairy farms</article-title>
					<source>Journal of Dairy Science</source>
					<volume>106</volume>
					<issue>11</issue>
					<fpage>7965</fpage>
					<lpage>7973</lpage>
					<issn>0022-0302</issn>
					<pub-id pub-id-type="doi">10.3168/JDS.2023-23267</pub-id>
				</element-citation>
			</ref>
			<ref id="B10">
				<mixed-citation>FAO. 2018. <italic>Panorama de la pobreza rural en América Latina y el Caribe</italic>. Roma, 114p. ISBN: 978-92-5-131085-4 Available at: <ext-link ext-link-type="uri" xlink:href="https://openknowledge.fao.org/handle/20.500.14283/ca2275es">https://openknowledge.fao.org/handle/20.500.14283/ca2275es</ext-link>. [Consulted: February 03, 2024].</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<collab>FAO</collab>
					</person-group>
					<year>2018</year>
					<source>Panorama de la pobreza rural en América Latina y el Caribe</source>
					<publisher-loc>Roma</publisher-loc>
					<size units="pages">114</size>
					<isbn>978-92-5-131085-4</isbn>
					<ext-link ext-link-type="uri" xlink:href="https://openknowledge.fao.org/handle/20.500.14283/ca2275es. [Consulted: February 03, 2024]">https://openknowledge.fao.org/handle/20.500.14283/ca2275es. [Consulted: February 03, 2024]</ext-link>
				</element-citation>
			</ref>
			<ref id="B11">
				<mixed-citation>FAO. 2022a. <italic>The State of Food and Agriculture 2022.</italic> Roma, 182p. ISBN: 978-92-5-136043-9. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.4060/cb9479en">https://doi.org/10.4060/cb9479en</ext-link>. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<collab>FAO</collab>
					</person-group>
					<year>2022</year>
					<source>The State of Food and Agriculture 2022</source>
					<publisher-loc>Roma</publisher-loc>
					<size units="pages">182</size>
					<isbn>978-92-5-136043-9</isbn>
					<pub-id pub-id-type="doi">10.4060/cb9479en</pub-id>
				</element-citation>
			</ref>
			<ref id="B12">
				<mixed-citation>FAO. 2022b. <italic>La aplicación de las mejores prácticas de la inteligencia artificial en el contexto de la agricultura,</italic> editado por Bishan Dong, 136. Roma: FAO Publications Catalogue 2022. ISBN: 78-92-5-136969-2. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<collab>FAO</collab>
					</person-group>
					<year>2022</year>
					<source>La aplicación de las mejores prácticas de la inteligencia artificial en el contexto de la agricultura</source>
					<person-group person-group-type="editor">
						<name>
							<surname>Bishan</surname>
							<given-names>Dong</given-names>
						</name>
					</person-group>
					<size units="pages">136</size>
					<publisher-loc>Roma</publisher-loc>
					<publisher-name>FAO Publications</publisher-name>
					<comment>Catalogue 2022</comment>
					<isbn>78-92-5-136969-2</isbn>
				</element-citation>
			</ref>
			<ref id="B13">
				<mixed-citation>FAO. 2023a. <italic>FAO analiza fortalezas y brechas de la producción láctea en América Latina y el Caribe,</italic> Más Allá de La Finca Lechera. Available at: <ext-link ext-link-type="uri" xlink:href="https://www.fao.org/americas/noticias/ver/es/c/1617544/">https://www.fao.org/americas/noticias/ver/es/c/1617544/</ext-link>. [Consulted: July 18, 2024]. </mixed-citation>
				<element-citation publication-type="webpage">
					<source>FAO</source>
					<year>2023</year>
					<article-title>FAO analiza fortalezas y brechas de la producción láctea en América Latina y el Caribe, Más Allá de La Finca Lechera</article-title>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://www.fao.org/americas/noticias/ver/es/c/1617544/">https://www.fao.org/americas/noticias/ver/es/c/1617544/</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-07-18">July 18, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B14">
				<mixed-citation>Franco, W. 2016. Propuestas para la innovación en los sistemas agroproductivos y el desarrollo sostenible del Valle Interandino en Carchi, Ecuador. <italic>Tierra Infinita</italic>, 2(1): 49-87, ISSN: 2631-2921. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.32645/26028131.104">https://doi.org/10.32645/26028131.104</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Franco</surname>
							<given-names>W.</given-names>
						</name>
					</person-group>
					<year>2016</year>
					<article-title>Propuestas para la innovación en los sistemas agroproductivos y el desarrollo sostenible del Valle Interandino en Carchi, Ecuador</article-title>
					<source>Tierra Infinita</source>
					<volume>2</volume>
					<issue>1</issue>
					<fpage>49</fpage>
					<lpage>87</lpage>
					<issn>2631-2921</issn>
					<pub-id pub-id-type="doi">10.32645/26028131.104</pub-id>
				</element-citation>
			</ref>
			<ref id="B15">
				<mixed-citation>Gaudin, Y. &amp; Padilla, R. 2020. Los intermediarios en cadenas de valor agropecuarias: un análisis de la apropiación y generación de valor agregado (N° 186 (LC/TS.2020/77; LC/MEX/TS.2020/15). Serie Estudios y Perspectivas-Sede Subregional de La CEPAL en México. Available at: <ext-link ext-link-type="uri" xlink:href="https://www.cepal.org/es/publicaciones/45796-intermediarios-cadenas-valor-agropecuarias-un-analisis-la-apropiacion-generacion">https://www.cepal.org/es/publicaciones/45796-intermediarios-cadenas-valor-agropecuarias-un-analisis-la-apropiacion-generacion</ext-link>. [Consulted: August 20, 2024]. </mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<name>
							<surname>Gaudin</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Padilla</surname>
							<given-names>R.</given-names>
						</name>
					</person-group>
					<year>2020</year>
					<article-title>Los intermediarios en cadenas de valor agropecuarias: un análisis de la apropiación y generación de valor agregado (N° 186 (LC/TS.2020/77; LC/MEX/TS.2020/15)</article-title>
					<source>Serie Estudios y Perspectivas-Sede Subregional de La CEPAL en México</source>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://www.cepal.org/es/publicaciones/45796-intermediarios-cadenas-valor-agropecuarias-un-analisis-la-apropiacion-generacion">https://www.cepal.org/es/publicaciones/45796-intermediarios-cadenas-valor-agropecuarias-un-analisis-la-apropiacion-generacion</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-08-20">August 20, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B16">
				<mixed-citation>Gaurav, K.A. &amp; Patel, L. 2020. Machine Learning With R. In S. Khalid (Ed.), Applications of Artificial Intelligence in Electrical Engineering (pp. 291-331), ISBN: 9781799827184. IGI Global. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.4018/978-1-7998-2718-4.ch015">https://doi.org/10.4018/978-1-7998-2718-4.ch015</ext-link>.</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Gaurav</surname>
							<given-names>K.A.</given-names>
						</name>
						<name>
							<surname>Patel</surname>
							<given-names>L.</given-names>
						</name>
					</person-group>
					<year>2020</year>
					<person-group person-group-type="author">
						<collab>Machine Learning With R</collab>
					</person-group>
					<person-group person-group-type="editor">
						<name>
							<surname>Khalid</surname>
							<given-names>S.</given-names>
						</name>
					</person-group>
					<source>Applications of Artificial Intelligence in Electrical Engineering</source>
					<fpage>291</fpage>
					<lpage>331</lpage>
					<isbn>9781799827184</isbn>
					<pub-id pub-id-type="doi">10.4018/978-1-7998-2718-4.ch015</pub-id>
				</element-citation>
			</ref>
			<ref id="B17">
				<mixed-citation>Géron, A. 2019. Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems (2nd ed.). O’Reilly Media. ISBN: 978-1-492-03264-9. Available at: <ext-link ext-link-type="uri" xlink:href="https://books.google.com.ec/books?id=HnetDwAAQBAJ&amp;printsec=frontcover&amp;hl=es&amp;source=gbs_book_other_versions#v=onepage&amp;q&amp;f=false">https://books.google.com.ec/books?id=HnetDwAAQBAJ&amp;printsec=frontcover&amp;hl=es&amp;source=gbs_book_other_versions#v=onepage&amp;q&amp;f=false</ext-link>. [Consulted: August 10, 2024]. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Géron</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<year>2019</year>
					<source>Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems</source>
					<edition>2nd</edition>
					<publisher-name>O’Reilly Media</publisher-name>
					<isbn>978-1-492-03264-9</isbn>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://books.google.com.ec/books?id=HnetDwAAQBAJ&amp;printsec=frontcover&amp;hl=es&amp;source=gbs_book_other_versions#v=onepage&amp;q&amp;f=false">https://books.google.com.ec/books?id=HnetDwAAQBAJ&amp;printsec=frontcover&amp;hl=es&amp;source=gbs_book_other_versions#v=onepage&amp;q&amp;f=false</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-08-10">August 10, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B18">
				<mixed-citation>Gil Montelongo, M. &amp; Hernández Villa, X. 2019. Risk management as a tool in the internal control on organizations of the dairy sector. <italic>Ekotemas</italic>, 5(2): 51-66, ISSN: 2414-4681. <ext-link ext-link-type="uri" xlink:href="https://www.ekotemas.cu/index.php/ekotemas/article/view/63/54">https://www.ekotemas.cu/index.php/ekotemas/article/view/63/54</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Gil Montelongo</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Hernández Villa</surname>
							<given-names>X.</given-names>
						</name>
					</person-group>
					<year>2019</year>
					<article-title>Risk management as a tool in the internal control on organizations of the dairy sector</article-title>
					<source>Ekotemas</source>
					<volume>5</volume>
					<issue>2</issue>
					<fpage>51</fpage>
					<lpage>66</lpage>
					<issn>2414-4681</issn>
					<ext-link ext-link-type="uri" xlink:href="https://www.ekotemas.cu/index.php/ekotemas/article/view/63/54">https://www.ekotemas.cu/index.php/ekotemas/article/view/63/54</ext-link>
				</element-citation>
			</ref>
			<ref id="B19">
				<mixed-citation>Hernández-Sampieri, R., &amp; Mendoza, C. 2018. Metodología de la investigación. Las rutas cuantitativa, cualitativa y mixta. In Interamericana (Ed.), McGRAW-HILL Interamericana Editores S.A. de C.V. Mc Graw Hill. ISBN: 978-1-4562-6096-5.</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Hernández-Sampieri</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Mendoza</surname>
							<given-names>C.</given-names>
						</name>
					</person-group>
					<year>2018</year>
					<source>Metodología de la investigación. Las rutas cuantitativa, cualitativa y mixta</source>
					<person-group person-group-type="editor">
						<collab>Interamericana</collab>
					</person-group>
					<publisher-name>McGRAW-HILL Interamericana Editores S.A. de C.V. Mc Graw Hill</publisher-name>
					<isbn>978-1-4562-6096-5</isbn>
				</element-citation>
			</ref>
			<ref id="B20">
				<mixed-citation>Ionita, E. 2022. La producción de leche en Ecuador, Veterinaria Digital. Available at: <ext-link ext-link-type="uri" xlink:href="https://www.veterinariadigital.com/articulos/la-produccion-de-leche-en-ecuador/">https://www.veterinariadigital.com/articulos/la-produccion-de-leche-en-ecuador/</ext-link>. [Consulted: January 20, 2024]. </mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<name>
							<surname>Ionita</surname>
							<given-names>E.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<source>La producción de leche en Ecuador, Veterinaria Digital</source>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://www.veterinariadigital.com/articulos/la-produccion-de-leche-en-ecuador/">https://www.veterinariadigital.com/articulos/la-produccion-de-leche-en-ecuador/</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-01-20">January 20, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B21">
				<mixed-citation>Ji, B., Banhazi, T., Phillips, C.J.C., Wang, C. &amp; Li, B. 2022. A machine learning framework to predict the next month’s daily milk yield, milk composition and milking frequency for cows in a robotic dairy farm. <italic>Biosystems Engineering</italic>, 216(9): 186-197, ISSN: 1537-5110. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.biosystemseng.2022.02.013">https://doi.org/10.1016/j.biosystemseng.2022.02.013</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Ji</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Banhazi</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Phillips</surname>
							<given-names>C.J.C.</given-names>
						</name>
						<name>
							<surname>Wang</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Li</surname>
							<given-names>B.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>A machine learning framework to predict the next month’s daily milk yield, milk composition and milking frequency for cows in a robotic dairy farm</article-title>
					<source>Biosystems Engineering</source>
					<volume>216</volume>
					<issue>9</issue>
					<fpage>186</fpage>
					<lpage>197</lpage>
					<issn>1537-5110</issn>
					<pub-id pub-id-type="doi">10.1016/j.biosystemseng.2022.02.013</pub-id>
				</element-citation>
			</ref>
			<ref id="B22">
				<mixed-citation>Kassahun, A., Bloo, R., Catal, C. &amp; Mishra, A. 2022. Dairy Farm Management Information Systems. <italic>Electronics</italic>, 11(2): 1-18, ISSN: 2079-9292. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3390/electronics11020239">https://doi.org/10.3390/electronics11020239</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Kassahun</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Bloo</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Catal</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Mishra</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>Dairy Farm Management Information Systems</article-title>
					<source>Electronics</source>
					<volume>11</volume>
					<issue>2</issue>
					<fpage>1</fpage>
					<lpage>18</lpage>
					<issn>2079-9292</issn>
					<pub-id pub-id-type="doi">10.3390/electronics11020239</pub-id>
				</element-citation>
			</ref>
			<ref id="B23">
				<mixed-citation>Kliś, P., Piwczyński, D., Sawa, A. &amp; Sitkowska, B. 2021. Prediction of Lactational Milk Yield of Cows Based on Data Recorded by AMS during the Periparturient Period. <italic>Animals</italic>, 11(383): 1-11, ISSN: 2076-2615. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3390/ANI11020383">https://doi.org/10.3390/ANI11020383</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Kliś</surname>
							<given-names>P.</given-names>
						</name>
						<name>
							<surname>Piwczyński</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Sawa</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Sitkowska</surname>
							<given-names>B.</given-names>
						</name>
					</person-group>
					<year>2021</year>
					<article-title>Prediction of Lactational Milk Yield of Cows Based on Data Recorded by AMS during the Periparturient Period</article-title>
					<source>Animals</source>
					<volume>11</volume>
					<issue>383</issue>
					<fpage>1</fpage>
					<lpage>11</lpage>
					<issn>2076-2615</issn>
					<pub-id pub-id-type="doi">10.3390/ANI11020383</pub-id>
				</element-citation>
			</ref>
			<ref id="B24">
				<mixed-citation>Mannepalli, P.K., Kulurkar, P., Jangade, V., Khan, A., &amp; Singh, P. 2024. An Enhanced Classification Model for Depression Detection Based on Machine Learning with Feature Selection Technique. En P. K. Jha, B. Tripathi, E. Natarajan, &amp; H. Sharma (Eds.), <italic>Proceedings of Congress on Control, Robotics, and Mechatronics</italic> (Vol. 364, pp. 589-601). Springer Nature Singapore. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/978-981-99-5180-2_46">https://doi.org/10.1007/978-981-99-5180-2_46</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Mannepalli</surname>
							<given-names>P.K.</given-names>
						</name>
						<name>
							<surname>Kulurkar</surname>
							<given-names>P.</given-names>
						</name>
						<name>
							<surname>Jangade</surname>
							<given-names>V.</given-names>
						</name>
						<name>
							<surname>Khan</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Singh</surname>
							<given-names>P.</given-names>
						</name>
					</person-group>
					<year>2024</year>
					<chapter-title>An Enhanced Classification Model for Depression Detection Based on Machine Learning with Feature Selection Technique</chapter-title>
					<person-group person-group-type="editor">
						<name>
							<surname>Jha</surname>
							<given-names>P.K.</given-names>
						</name>
						<name>
							<surname>Tripathi</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Natarajan</surname>
							<given-names>E.</given-names>
						</name>
						<name>
							<surname>Sharma</surname>
							<given-names>H.</given-names>
						</name>
					</person-group>
					<source>Proceedings of Congress on Control, Robotics, and Mechatronics</source>
					<volume>364</volume>
					<fpage>589</fpage>
					<lpage>601</lpage>
					<pub-id pub-id-type="doi">10.1007/978-981-99-5180-2_46</pub-id>
				</element-citation>
			</ref>
			<ref id="B25">
				<mixed-citation>Moreno, F. 2018. Caracterización socioeconómica y productiva de la cadena de valor agroalimentaria de la leche en la provincia de Tungurahua. Tesis presentada en opción al Título de carrera de Ingeniería de los alimentos, Universidad Técnica de Ambato, Ecuador. </mixed-citation>
				<element-citation publication-type="thesis">
					<person-group person-group-type="author">
						<name>
							<surname>Moreno</surname>
							<given-names>F.</given-names>
						</name>
					</person-group>
					<year>2018</year>
					<source>Caracterización socioeconómica y productiva de la cadena de valor agroalimentaria de la leche en la provincia de Tungurahua</source>
					<comment content-type="degree">Tesis presentada en opción al Título de carrera de Ingeniería de los alimentos</comment>
					<publisher-name>Universidad Técnica de Ambato</publisher-name>
					<publisher-loc>Ecuador</publisher-loc>
				</element-citation>
			</ref>
			<ref id="B26">
				<mixed-citation>Morocho, B., Carvajal, H. &amp; Vite, H. 2021. Análisis socioeconómico del agronegocio ganadero: Caso productores de la Aso Ganaderos del Altiplano Orense 5 de noviembre del cantón Atahualpa. <italic>Revista Metropolitana de Ciencias Aplicadas</italic>, 4(1): 26-32, ISSN: 2631-2662.</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Morocho</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Carvajal</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Vite</surname>
							<given-names>H.</given-names>
						</name>
					</person-group>
					<year>2021</year>
					<article-title>Análisis socioeconómico del agronegocio ganadero: Caso productores de la Aso Ganaderos del Altiplano Orense 5 de noviembre del cantón Atahualpa</article-title>
					<source>Revista Metropolitana de Ciencias Aplicadas</source>
					<volume>4</volume>
					<issue>1</issue>
					<fpage>26</fpage>
					<lpage>32</lpage>
					<issn>2631-2662</issn>
				</element-citation>
			</ref>
			<ref id="B27">
				<mixed-citation>Mwanga, G., Lockwood, S., Mujibi, D., Yonah, Z. &amp; Chagunda, M. 2020. Machine learning models for predicting the use of different animal breeding services in smallholder dairy farms in Sub-Saharan Africa.<italic>Tropical Animal Health and Production,</italic>52(3): 1081-1091, ISSN: 1573-7438. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s11250-019-02097-5">https://doi.org/10.1007/s11250-019-02097-5</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Mwanga</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Lockwood</surname>
							<given-names>S.</given-names>
						</name>
						<name>
							<surname>Mujibi</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Yonah</surname>
							<given-names>Z.</given-names>
						</name>
						<name>
							<surname>Chagunda</surname>
							<given-names>M.</given-names>
						</name>
					</person-group>
					<year>2020</year>
					<article-title>Machine learning models for predicting the use of different animal breeding services in smallholder dairy farms in Sub-Saharan Africa</article-title>
					<source>Tropical Animal Health and Production</source>
					<volume>52</volume>
					<issue>3</issue>
					<fpage>1081</fpage>
					<lpage>1091</lpage>
					<issn>1573-7438</issn>
					<pub-id pub-id-type="doi">10.1007/s11250-019-02097-5</pub-id>
				</element-citation>
			</ref>
			<ref id="B28">
				<mixed-citation>Natekin, A. &amp; Knoll, A. 2013. Gradient boosting machines, a tutorial. <italic>Frontiers in Neurorobotics</italic>, 7(21): 1-21, ISSN: 1662-5218. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3389/fnbot.2013.00021">https://doi.org/10.3389/fnbot.2013.00021</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Natekin</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Knoll</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<year>2013</year>
					<article-title>Gradient boosting machines, a tutorial</article-title>
					<source>Frontiers in Neurorobotics</source>
					<volume>7</volume>
					<issue>21</issue>
					<fpage>1</fpage>
					<lpage>21</lpage>
					<issn>1662-5218</issn>
					<pub-id pub-id-type="doi">10.3389/fnbot.2013.00021</pub-id>
				</element-citation>
			</ref>
			<ref id="B29">
				<mixed-citation>Nyambo, D.G., Malamsha, G.C. &amp; Mavura, F. 2023. Leveraging Machine Learning Techniques to Improve Learning and Recommendations Within Dairy Farms: Towards High Milk Yields for Small-Scale Farmers. In F. Mtenzi, G. Oreku, &amp; D. Lupiana (Eds.), <italic>Impact of Disruptive Technologies on the Socio-Economic Development of Emerging Countries</italic> (pp. 172-188), ISBN: 9781668468739. IGI Global. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.4018/978-1-6684-6873-9.ch011">https://doi.org/10.4018/978-1-6684-6873-9.ch011</ext-link>. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Nyambo</surname>
							<given-names>D.G.</given-names>
						</name>
						<name>
							<surname>Malamsha</surname>
							<given-names>G.C.</given-names>
						</name>
						<name>
							<surname>Mavura</surname>
							<given-names>F.</given-names>
						</name>
					</person-group>
					<year>2023</year>
					<chapter-title>Leveraging Machine Learning Techniques to Improve Learning and Recommendations Within Dairy Farms: Towards High Milk Yields for Small-Scale Farmers</chapter-title>
					<person-group person-group-type="editor">
						<name>
							<surname>Mtenzi</surname>
							<given-names>F.</given-names>
						</name>
						<name>
							<surname>Oreku</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Lupiana</surname>
							<given-names>D.</given-names>
						</name>
					</person-group>
					<source>Impact of Disruptive Technologies on the Socio-Economic Development of Emerging Countries</source>
					<fpage>172</fpage>
					<lpage>188</lpage>
					<isbn>9781668468739</isbn>
					<pub-id pub-id-type="doi">0.4018/978-1-6684-6873-9.ch011</pub-id>
				</element-citation>
			</ref>
			<ref id="B30">
				<mixed-citation>Orús, A. 2022. Leche de vaca: principales productores a nivel mundial en 2022. Estatista. Available at: <ext-link ext-link-type="uri" xlink:href="https://es.statista.com/estadisticas/600241/principales-productores-de-leche-de-vaca-en-el-mundo-en/">https://es.statista.com/estadisticas/600241/principales-productores-de-leche-de-vaca-en-el-mundo-en/</ext-link>. [Consulted: April 30, 2024]. </mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<name>
							<surname>Orús</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>Leche de vaca: principales productores a nivel mundial en 2022</article-title>
					<source>Estatista</source>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://es.statista.com/estadisticas/600241/principales-productores-de-leche-de-vaca-en-el-mundo-en/">https://es.statista.com/estadisticas/600241/principales-productores-de-leche-de-vaca-en-el-mundo-en/</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-04-30">April 30, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B31">
				<mixed-citation>Piwczyński, D., Sitkowska, B., Kolenda, M., Brzozowski, M., Aerts, J. &amp; Schork, P.M. 2020. Forecasting the milk yield of cows on farms equipped with automatic milking system with the use of decision trees. <italic>Animal Science Journal,</italic> 91(1): e13414, ISSN: 1740-0929. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1111/asj.13414">https://doi.org/10.1111/asj.13414</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Piwczyński</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Sitkowska</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Kolenda</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Brzozowski</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Aerts</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Schork</surname>
							<given-names>P.M.</given-names>
						</name>
					</person-group>
					<year>2020</year>
					<article-title>Forecasting the milk yield of cows on farms equipped with automatic milking system with the use of decision trees</article-title>
					<source>Animal Science Journal</source>
					<volume>91</volume>
					<issue>1</issue>
					<elocation-id>e13414</elocation-id>
					<issn>1740-0929</issn>
					<pub-id pub-id-type="doi">10.1111/asj.13414</pub-id>
				</element-citation>
			</ref>
			<ref id="B32">
				<mixed-citation>Peña, Y., Benitez, D., Ray, J. &amp; Fernández, Y. 2018. Factores determinantes de la producción ganadera en una comunidad campesina del suroeste de Holguín, Cuba. <italic>Cuban Journal of Agricultural Science</italic>, 52(2): 155-163, ISSN: 2079-3480. <ext-link ext-link-type="uri" xlink:href="http://scielo.sld.cu/scielo.php?pid=S2079-34802018000200155&amp;script=sci_arttext&amp;tlng=es">http://scielo.sld.cu/scielo.php?pid=S2079-34802018000200155&amp;script=sci_arttext&amp;tlng=es</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Peña</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Benitez</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Ray</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Fernández</surname>
							<given-names>Y.</given-names>
						</name>
					</person-group>
					<year>2018</year>
					<article-title>Factores determinantes de la producción ganadera en una comunidad campesina del suroeste de Holguín, Cuba</article-title>
					<source>Cuban Journal of Agricultural Science</source>
					<volume>52</volume>
					<issue>2</issue>
					<fpage>155</fpage>
					<lpage>163</lpage>
					<issn>2079-3480</issn>
					<ext-link ext-link-type="uri" xlink:href="http://scielo.sld.cu/scielo.php?pid=S2079-34802018000200155&amp;script=sci_arttext&amp;tlng=es">http://scielo.sld.cu/scielo.php?pid=S2079-34802018000200155&amp;script=sci_arttext&amp;tlng=es</ext-link>
				</element-citation>
			</ref>
			<ref id="B33">
				<mixed-citation>Prefectura del Carchi. 2023. Datos informativos de la provincia. Available at: <ext-link ext-link-type="uri" xlink:href="https://carchi.gob.ec/2016f/index.php/informacion-provincial.html">https://carchi.gob.ec/2016f/index.php/informacion-provincial.html</ext-link>. [Consulted: April 25, 2024]. </mixed-citation>
				<element-citation publication-type="webpage">
					<source>Prefectura del Carchi</source>
					<year>2023</year>
					<article-title>Datos informativos de la provincia</article-title>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://carchi.gob.ec/2016f/index.php/informacion-provincial.html">https://carchi.gob.ec/2016f/index.php/informacion-provincial.html</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-04-25">April 25, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B34">
				<mixed-citation>Radwan, H., Qaliouby, H. &amp; Elfadl, E. 2020. Classification and prediction of milk yield level for Holstein Friesian cattle using parametric and non-parametric statistical classification models. <italic>Journal of Advanced Veterinary and Animal Research</italic>, 7(3): 429-435, ISSN: 2311-7710. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5455/javar.2020.g438">https://doi.org/10.5455/javar.2020.g438</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Radwan</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Qaliouby</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Elfadl</surname>
							<given-names>E.</given-names>
						</name>
					</person-group>
					<year>2020</year>
					<article-title>Classification and prediction of milk yield level for Holstein Friesian cattle using parametric and non-parametric statistical classification models</article-title>
					<source>Journal of Advanced Veterinary and Animal Research</source>
					<volume>7</volume>
					<issue>3</issue>
					<fpage>429</fpage>
					<lpage>435</lpage>
					<issn>2311-7710</issn>
					<pub-id pub-id-type="doi">10.5455/javar.2020.g438</pub-id>
				</element-citation>
			</ref>
			<ref id="B35">
				<mixed-citation>Requelme, N. &amp; Bonifaz, N. 2012. Caracterización de sistemas de producción lechera de Ecuador. <italic>La Granja</italic>, 15(1): 56-69, ISSN: 1390-3799.</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Requelme</surname>
							<given-names>N.</given-names>
						</name>
						<name>
							<surname>Bonifaz</surname>
							<given-names>N.</given-names>
						</name>
					</person-group>
					<year>2012</year>
					<article-title>Caracterización de sistemas de producción lechera de Ecuador</article-title>
					<source>La Granja</source>
					<volume>15</volume>
					<issue>1</issue>
					<fpage>56</fpage>
					<lpage>69</lpage>
					<issn>1390-3799</issn>
				</element-citation>
			</ref>
			<ref id="B36">
				<mixed-citation>Saini, A. 2021. Gradient Boosting Algorithm: A Complete Guide for Beginners. Analytics Vidhya. Available at: <ext-link ext-link-type="uri" xlink:href="https://www.analyticsvidhya.com/blog/2021/09/gradient-boosting-algorithm-a-complete-guide-for-beginners/">https://www.analyticsvidhya.com/blog/2021/09/gradient-boosting-algorithm-a-complete-guide-for-beginners/</ext-link>. [Consulted: March 21, 2024]. </mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<name>
							<surname>Saini</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<year>2021</year>
					<article-title>Gradient Boosting Algorithm: A Complete Guide for Beginners</article-title>
					<source>Analytics Vidhya</source>
					<comment>Available at: <ext-link ext-link-type="uri" xlink:href="https://www.analyticsvidhya.com/blog/2021/09/gradient-boosting-algorithm-a-complete-guide-for-beginners/">https://www.analyticsvidhya.com/blog/2021/09/gradient-boosting-algorithm-a-complete-guide-for-beginners/</ext-link>
					</comment>
					<date-in-citation content-type="access-date" iso-8601-date="2024-03-21">March 21, 2024</date-in-citation>
				</element-citation>
			</ref>
			<ref id="B37">
				<mixed-citation>Siddiqui, T. &amp; Amer, A.Y.A. 2024. A comprehensive review on text classification and text mining techniques using spam dataset detection. In <italic>Mathematics and Computer Science</italic>, vol. <italic>2</italic>, editado por Ghosh, S., Niranjanamurthy, M., Deyasi, K., Mallik, B. &amp; Das, S., 1-17. Editorial Wiley, ISBN: 978-111989671-5. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/9781119896715.ch1">https://doi.org/10.1002/9781119896715.ch1</ext-link>.</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Siddiqui</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Amer</surname>
							<given-names>A.Y.A.</given-names>
						</name>
					</person-group>
					<year>2024</year>
					<chapter-title>A comprehensive review on text classification and text mining techniques using spam dataset detection</chapter-title>
					<source>Mathematics and Computer Science</source>
					<volume>2</volume>
					<person-group person-group-type="editor">
						<name>
							<surname>Ghosh</surname>
							<given-names>S.</given-names>
						</name>
						<name>
							<surname>Niranjanamurthy</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Deyasi</surname>
							<given-names>K.</given-names>
						</name>
						<name>
							<surname>Mallik</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Das</surname>
							<given-names>S.</given-names>
						</name>
					</person-group>
					<fpage>1</fpage>
					<lpage>17</lpage>
					<publisher-name>Editorial Wiley</publisher-name>
					<isbn>978-111989671-5</isbn>
					<pub-id pub-id-type="doi">10.1002/9781119896715.ch1</pub-id>
				</element-citation>
			</ref>
			<ref id="B38">
				<mixed-citation>Slob, N., Catal, C. &amp; Kassahun, A. 2021. Application of machine learning to improve dairy farm management: A systematic literature review. <italic>Preventive Veterinary Medicine</italic>, 187: 105237, ISSN: 1873-1716. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.prevetmed.2020.105237">https://doi.org/10.1016/j.prevetmed.2020.105237</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Slob</surname>
							<given-names>N.</given-names>
						</name>
						<name>
							<surname>Catal</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Kassahun</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<year>2021</year>
					<article-title>Application of machine learning to improve dairy farm management: A systematic literature review</article-title>
					<source>Preventive Veterinary Medicine</source>
					<volume>187</volume>
					<fpage>105237</fpage>
					<lpage>105237</lpage>
					<issn>1873-1716</issn>
					<pub-id pub-id-type="doi">10.1016/j.prevetmed.2020.105237</pub-id>
				</element-citation>
			</ref>
			<ref id="B39">
				<mixed-citation>Suthaharan, S. 2016. Decision Tree Learning, In <italic>Machine Learning Models and Algorithms for Big Data Classification</italic>, Integrated Series in Information Systems, vol 36. Springer, Boston, MA., 237-269, ISBN: 9781489976413. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/978-1-4899-7641-3_10">https://doi.org/10.1007/978-1-4899-7641-3_10</ext-link>. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Suthaharan</surname>
							<given-names>S.</given-names>
						</name>
					</person-group>
					<year>2016</year>
					<chapter-title>Decision Tree Learning</chapter-title>
					<source><italic>Machine Learning Models and Algorithms for Big Data Classification</italic>, Integrated Series in Information Systems</source>
					<volume>36</volume>
					<publisher-name>Springer</publisher-name>
					<publisher-loc>Boston, MA.</publisher-loc>
					<fpage>237</fpage>
					<lpage>269</lpage>
					<isbn>9781489976413</isbn>
					<pub-id pub-id-type="doi">10.1007/978-1-4899-7641-3_10</pub-id>
				</element-citation>
			</ref>
			<ref id="B40">
				<mixed-citation>Suseendran, G. &amp; Duraisamy, B. 2021. Predication of Dairy Milk Production Using Machine Learning Techniques. In: Peng, SL., Hsieh, SY., Gopalakrishnan, S., Duraisamy, B. (eds) <italic>Intelligent Computing and Innovation on Data Science. Lecture Notes in Networks and Systems, 248</italic>: Springer, Singapore, ISBN: 978-981-16-3153-5. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/978-981-16-3153-5_60">https://doi.org/10.1007/978-981-16-3153-5_60</ext-link>. </mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Suseendran</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Duraisamy</surname>
							<given-names>B.</given-names>
						</name>
					</person-group>
					<year>2021</year>
					<chapter-title>Predication of Dairy Milk Production Using Machine Learning Techniques</chapter-title>
					<person-group person-group-type="editor">
						<name>
							<surname>Peng</surname>
							<given-names>SL.</given-names>
						</name>
						<name>
							<surname>Hsieh</surname>
							<given-names>SY.</given-names>
						</name>
						<name>
							<surname>Gopalakrishnan</surname>
							<given-names>S.</given-names>
						</name>
						<name>
							<surname>Duraisamy</surname>
							<given-names>B.</given-names>
						</name>
					</person-group>
					<source>Intelligent Computing and Innovation on Data Science. Lecture Notes in Networks and Systems</source>
					<volume>248</volume>
					<publisher-name>Springer</publisher-name>
					<publisher-loc>Singapore</publisher-loc>
					<isbn>978-981-16-3153-5</isbn>
					<pub-id pub-id-type="doi">10.1007/978-981-16-3153-5_60</pub-id>
				</element-citation>
			</ref>
			<ref id="B41">
				<mixed-citation>Tangorra, F. M., Calcante, A., Vigone, G., Assirelli, A. &amp; Bisaglia, C. 2022. Assessment of technical-productive aspects in Italian dairy farms equipped with automatic milking systems: A multivariate statistical analysis approach. <italic>Journal of Dairy Science</italic>, 105(9): 7539-7549, ISSN: 0022-0302. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3168/jds.2021-20859">https://doi.org/10.3168/jds.2021-20859</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Tangorra</surname>
							<given-names>F. M.</given-names>
						</name>
						<name>
							<surname>Calcante</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Vigone</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Assirelli</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Bisaglia</surname>
							<given-names>C.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>Assessment of technical-productive aspects in Italian dairy farms equipped with automatic milking systems: A multivariate statistical analysis approach</article-title>
					<source>Journal of Dairy Science</source>
					<volume>105</volume>
					<issue>9</issue>
					<fpage>7539</fpage>
					<lpage>7549</lpage>
					<issn>0022-0302</issn>
					<pub-id pub-id-type="doi">10.3168/jds.2021-20859</pub-id>
				</element-citation>
			</ref>
			<ref id="B42">
				<mixed-citation>Terán, G. &amp; Cobo, R. 2017. Determining management factors in dairy farms in Carchi, Ecuador. <italic>Cuban Journal of Agricultural Science</italic>, 51(2): 175-182, ISSN: 2079-3480. <ext-link ext-link-type="uri" xlink:href="http://cjascience.com/index.php/CJAS/article/view/724">http://cjascience.com/index.php/CJAS/article/view/724</ext-link>.</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Terán</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Cobo</surname>
							<given-names>R.</given-names>
						</name>
					</person-group>
					<year>2017</year>
					<article-title>Determining management factors in dairy farms in Carchi, Ecuador</article-title>
					<source>Cuban Journal of Agricultural Science</source>
					<volume>51</volume>
					<issue>2</issue>
					<fpage>175</fpage>
					<lpage>182</lpage>
					<issn>2079-3480</issn>
					<ext-link ext-link-type="uri" xlink:href="http://cjascience.com/index.php/CJAS/article/view/724">http://cjascience.com/index.php/CJAS/article/view/724</ext-link>
				</element-citation>
			</ref>
			<ref id="B43">
				<mixed-citation>Treviño Cantú, J.A. 2022. Alternativas de estandarización para índices compuestos espacio-temporales. El caso del rezago educativo en los estados de México, 2000 a 2020. <italic>Investigaciones Geográficas</italic>, 109: 1-14, ISSN: 2448-7279. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.14350/rig.60615">https://doi.org/10.14350/rig.60615</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Treviño Cantú</surname>
							<given-names>J.A.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>Alternativas de estandarización para índices compuestos espacio-temporales. El caso del rezago educativo en los estados de México, 2000 a 2020</article-title>
					<source>Investigaciones Geográficas</source>
					<volume>109</volume>
					<fpage>1</fpage>
					<lpage>14</lpage>
					<issn>2448-7279</issn>
					<pub-id pub-id-type="doi">10.14350/rig.60615</pub-id>
				</element-citation>
			</ref>
			<ref id="B44">
				<mixed-citation>Valdez, A. 2019. Machine Learning para todos. En <italic>IV Congreso Nacional de Profesionales de Computación, Informática y Tecnologías</italic>. pp. 60. Perú: Ministerio de Educación. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.13140/RG.2.2.13786.70086">https://doi.org/10.13140/RG.2.2.13786.70086</ext-link>. </mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Valdez</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<year>2019</year>
					<source>Machine Learning para todos</source>
					<conf-name>IV Congreso Nacional de Profesionales de Computación, Informática y Tecnologías</conf-name>
					<conf-loc>Perú</conf-loc>
					<conf-sponsor>Ministerio de Educación</conf-sponsor>
					<size units="pages">60</size>
					<pub-id pub-id-type="doi">10.13140/RG.2.2.13786.70086</pub-id>
				</element-citation>
			</ref>
			<ref id="B45">
				<mixed-citation>Vásquez, H., Barrantes, C., Vigo, C. &amp; Maicelo, J. 2022. Factores socioeconómicos que influyen en la adopción de tecnologías para mejoramiento genético de ganado vacuno en Perú. <italic>Agricultura, Sociedad y Desarrollo</italic>, 19(3): 312-330, ISSN: 2594-0244. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.22231/asyd.v19i3.1358">https://doi.org/10.22231/asyd.v19i3.1358</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Vásquez</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Barrantes</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Vigo</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Maicelo</surname>
							<given-names>J.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>Factores socioeconómicos que influyen en la adopción de tecnologías para mejoramiento genético de ganado vacuno en Perú</article-title>
					<source>Agricultura, Sociedad y Desarrollo</source>
					<volume>19</volume>
					<issue>3</issue>
					<fpage>312</fpage>
					<lpage>330</lpage>
					<issn>2594-0244</issn>
					<pub-id pub-id-type="doi">10.22231/asyd.v19i3.1358</pub-id>
				</element-citation>
			</ref>
			<ref id="B46">
				<mixed-citation>Velasteguí, N. 2019. Cadena productiva del sector lechero en la provincia de Tungurahua, cantón Píllaro: Un estudio socio-económico de la producción de la leche cruda. Tesis presentada en opción al Título de carrera de Economía, Universidad Técnica de Ambato, Ecuador. </mixed-citation>
				<element-citation publication-type="thesis">
					<person-group person-group-type="author">
						<name>
							<surname>Velasteguí</surname>
							<given-names>N.</given-names>
						</name>
					</person-group>
					<year>2019</year>
					<source>Cadena productiva del sector lechero en la provincia de Tungurahua, cantón Píllaro: Un estudio socio-económico de la producción de la leche cruda</source>
					<comment content-type="degree">Tesis presentada en opción al Título de carrera de Economía</comment>
					<publisher-name>Universidad Técnica de Ambato</publisher-name>
					<publisher-loc>Ecuador</publisher-loc>
				</element-citation>
			</ref>
			<ref id="B47">
				<mixed-citation>Zemarku, Z., Senapathy, M. &amp; Bojago, E. 2022. Determinants of Adoption of Improved Dairy Technologies: The Case of Offa Woreda, Wolaita Zone, Southern Ethiopia. <italic>Advances in Agriculture</italic>, 2022: 1-19, ISSN: 2314-7539. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1155/2022/3947794">https://doi.org/10.1155/2022/3947794</ext-link>. </mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Zemarku</surname>
							<given-names>Z.</given-names>
						</name>
						<name>
							<surname>Senapathy</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Bojago</surname>
							<given-names>E.</given-names>
						</name>
					</person-group>
					<year>2022</year>
					<article-title>Determinants of Adoption of Improved Dairy Technologies: The Case of Offa Woreda, Wolaita Zone, Southern Ethiopia</article-title>
					<source>Advances in Agriculture</source>
					<fpage>1</fpage>
					<lpage>19</lpage>
					<issn>2314-7539</issn>
					<pub-id pub-id-type="doi">10.1155/2022/3947794</pub-id>
				</element-citation>
			</ref>
		</ref-list>
	</back>
	<sub-article article-type="translation" id="s1" xml:lang="es">
		<front-stub>
			<article-categories>
				<subj-group subj-group-type="heading">
					<subject>Ciencia Animal</subject>
				</subj-group>
			</article-categories>
			<title-group>
				<article-title>Clasificación de la producción lechera a pequeña escala en la zona fronteriza Ecuador-Colombia. Un estudio comparativo de técnicas de aprendizaje automático</article-title>
			</title-group>
			<contrib-group>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-3039-7657</contrib-id>
					<name>
						<surname>Carvajal-Pérez</surname>
						<given-names>L.</given-names>
					</name>
					<xref ref-type="aff" rid="aff3"><sup>1</sup></xref>
					<xref ref-type="corresp" rid="c2">*</xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0003-0126-0704</contrib-id>
					<name>
						<surname>Montenegro-Arellano</surname>
						<given-names>F.</given-names>
					</name>
					<xref ref-type="aff" rid="aff3"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0001-9029-9410</contrib-id>
					<name>
						<surname>Terán-Rosero</surname>
						<given-names>G.</given-names>
					</name>
					<xref ref-type="aff" rid="aff3"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-5125-8752</contrib-id>
					<name>
						<surname>Urgilés-Urgilés</surname>
						<given-names>Gladys</given-names>
					</name>
					<xref ref-type="aff" rid="aff3"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0009-0002-4350-413X</contrib-id>
					<name>
						<surname>Chulde-Chulde</surname>
						<given-names>Nayeli</given-names>
					</name>
					<xref ref-type="aff" rid="aff3"><sup>1</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-7516-7521</contrib-id>
					<name>
						<surname>Cobo-Cuña</surname>
						<given-names>R.</given-names>
					</name>
					<xref ref-type="aff" rid="aff4"><sup>2</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-2641-1815</contrib-id>
					<name>
						<surname>Herrera-Villafranca</surname>
						<given-names>Magaly</given-names>
					</name>
					<xref ref-type="aff" rid="aff4"><sup>2</sup></xref>
				</contrib>
			</contrib-group>
			<aff id="aff3">
				<label>1</label>
				<institution content-type="original">Universidad Politécnica Estatal del Carchi, Antisana y Universitaria, Tulcán, Ecuador</institution>
				<institution content-type="normalized">Universidad Politécnica Estatal del Carchi</institution>
				<institution content-type="orgname">Universidad Politécnica Estatal del Carchi</institution>
				<addr-line>
					<state>Tulcán</state>
				</addr-line>
				<country country="EC">Ecuador</country>
			</aff>
			<aff id="aff4">
				<label>2</label>
				<institution content-type="original">Instituto de Ciencia Animal, C. Central, km 47 ½, San José de las Lajas, Mayabeque, Cuba</institution>
				<institution content-type="normalized">Instituto de Ciencia Animal</institution>
				<institution content-type="orgname">Instituto de Ciencia Animal</institution>
				<addr-line>
					<city>San José de las Lajas</city>
					<state>Mayabeque</state>
				</addr-line>
				<country country="CU">Cuba</country>
			</aff>
			<author-notes>
				<corresp id="c2">
					<label>*</label>Email:<email>luis.carvajal@upec.edu.ec</email>
				</corresp>
				<fn fn-type="conflict" id="fn3">
					<p><bold>Conflicto de intereses</bold>: Los autores declaran que no existe conflicto de intereses entre ellos.</p>
				</fn>
				<fn fn-type="con" id="fn4">
					<p><bold>Declaración de contribución de autoría CRediT</bold>: L. Carvajal-Pérez: <bold>Conceptualización, Investigación, Análisis formal, Redacción-borrador original.</bold> F. Montenegro- Arellano: <bold>Conceptualización, Investigación.</bold> G. Terán-Rosero: <bold>Metodología, Análisis formal.</bold> Gladys Urgilés-Urgilés: <bold>Adquisición de fondos, Recursos.</bold> Nayeli Chulde-Chulde: <bold>Curación de datos.</bold> R. Cobo-Cuña: <bold>Validación.</bold> Magaly Herrera-Villafranca: <bold>Análisis formal, Redacción-borrador original</bold></p>
				</fn>
			</author-notes>
			<abstract>
				<p>Se investigaron los factores socioeconómicos determinantes en la producción en granjas lecheras. Se involucró la clasificación de los productores a pequeña escala en la zona fronteriza entre Ecuador y Colombia. Un total de 532 agricultores participaron en la encuesta y los datos recopilados se analizaron mediante técnicas de aprendizaje automático. Los datos se sometieron a un preprocesamiento exhaustivo para eliminar errores y valores atípicos relacionados con los factores socioeconómicos en la producción de leche del Carchi, Ecuador. Entre las variables examinadas, el ingreso económico, el precio por litro de leche y la cantidad de litros utilizados para la producción de queso surgieron como los factores más influyentes. Los resultados mostraron que las técnicas de aprendizaje automático pueden clasificar eficazmente la producción láctea a pequeña escala, con precisión superior a 96 %. La presencia de un hijo que proporciona apoyo económico al hogar, la asignación de leche para la producción como para la venta de queso, junto con su utilización para el consumo familiar, influyeron significativamente en 90 % de los participantes encuestados.</p>
			</abstract>
			<kwd-group xml:lang="es">
				<title>Palabras clave:</title>
				<kwd>bienestar económico</kwd>
				<kwd>modelos de clasificación</kwd>
				<kwd>pequeños productores lecheros</kwd>
				<kwd>productividad lechera</kwd>
			</kwd-group>
		</front-stub>
		<body>
			<sec sec-type="intro">
				<title>Introducción</title>
				<p>La producción de leche es una importante actividad económica en el mundo. Para el 2023, la producción de leche superó los 950 millones de toneladas. En las economías emergentes, aproximadamente 80 % de la producción proviene de explotaciones familiares con uso limitado de insumos, lo que se traduce en menores rendimientos por animal. El 20 % de las explotaciones son medianas y grandes, de ellas 4 % invierte en tecnología para cumplir con los estándares de calidad (<xref ref-type="bibr" rid="B13">FAO 2023a</xref>).</p>
				<p>En 2022, la Unión Europea (formada por 27 países) fue el mayor productor del mundo con 144 millones de toneladas. Le siguió los Estados Unidos con 103 millones de toneladas y la India con 97 millones de toneladas (<xref ref-type="bibr" rid="B30">Orús 2022</xref>). En Ecuador se producían, aproximadamente, 6.15 millones de litros de leche por día, que generaban ingresos para 1,3 millones de habitantes (<xref ref-type="bibr" rid="B20">Ionita 2022</xref>). La producción de leche aporta 4 % al producto interno bruto agroindustrial del país y muestra crecimiento de 10.92 % respecto al 2020. La región Sierra aporta 73 % de la producción, la Costa 19 % y la Amazónica 8 % (<xref ref-type="bibr" rid="B8">CIL Ecuador 2023</xref>).</p>
				<p>La producción de leche usa factores de producción que incluyen la tierra, el capital, la mano de obra, la tecnología y, según algunos autores, la gestión empresarial para transformarlos y contribuir a mejorar las condiciones de vida de los productores. </p>
				<p>Los factores sociales de mayor incidencia son el género, el nivel de educación, formación, experiencia o asociatividad (<xref ref-type="bibr" rid="B47">Zemarku <italic>et al</italic>. 2022</xref>). Asimismo, se identificaron factores económicos como ingresos, costos, tamaño del rebaño, volumen de producción (<xref ref-type="bibr" rid="B45">Vásquez <italic>et al</italic>. 2022</xref>); además, en el proceso productivo es fundamental la disponibilidad de tierra, alimentos y cuidados veterinarios (<xref ref-type="bibr" rid="B32">Peña <italic>et al</italic>. 2018</xref>), sin dejar de lado las innovaciones en el sistema de cría y el uso de equipos de automatización para una producción de calidad (<xref ref-type="bibr" rid="B41">Tangorra <italic>et al</italic>. 2022</xref>).</p>
				<p>El sector lácteo permite a las poblaciones rurales producir y comercializar sus productos, lo que contribuye al desarrollo económico local, la seguridad alimentaria, el desarrollo económico y, por tanto, a una mejor calidad de vida de los agricultores (<xref ref-type="bibr" rid="B11">FAO 2022a</xref>). Es un sector que siempre está cambiando. Necesita invertir en nueva tecnología para ser eficiente. Esto perjudica a los pequeños productores, que no pueden permitirse invertir (<xref ref-type="bibr" rid="B18">Gily Hernández 2019</xref>). Además, la cadena de valor de los lácteos impulsa a los pequeños, micro y medianos productores, ya que les ayuda a procesar y vender productos lácteos (<xref ref-type="bibr" rid="B15">Gaudin y Padilla 2020</xref>).</p>
				<p>El área de estudio comprende la provincia del Carchi. Está en el norte de Ecuador, en la frontera con Colombia. El 63 % del territorio se encuentra en la zona templada húmeda. Se encuentra entre 1.800 y 3.000 m s.n.m. y entre 12 y 18 °C. La temperatura depende de si es seco o lluvioso (<xref ref-type="bibr" rid="B14">Franco 2016</xref>). El otro 37 % se encuentra en la región subtemplada, muy húmeda. Está en los páramos bajos, entre 3.000 y 4.000 m s.n.m. La temperatura es de 6 a 12 °C. Las precipitaciones son de 1000 a 1500 mm al año, sin ningún mes de máxima precipitación (<xref ref-type="bibr" rid="B35">Requelme y Bonifaz 2012</xref>).</p>
				<p>La producción lechera del Carchi ocupa el tercer lugar en producción nacional. Se basa en las familias, tienen una fuerte presencia en el mercado informal (<xref ref-type="bibr" rid="B26">Morocho <italic>et al</italic>. 2021</xref>), emplea 36 % de la población (<xref ref-type="bibr" rid="B42">Terán y Cobo 2017</xref>). Existen 8957 fincas ganaderas (<xref ref-type="bibr" rid="B33">Prefectura del Carchi 2023</xref>). </p>
				<p>El sistema principal es el extensivo, con prácticas tradicionales y presencia de mucho ganado criollo. Las vacas producen una media de 9.4 L al día. Esto es superior al promedio nacional de 5.9 L (<xref ref-type="bibr" rid="B7">Carvajal 2014</xref>). Las fincas con ganado Holstein alcanzan rendimientos de 15 a 18 L por vaca por día (<xref ref-type="bibr" rid="B4">Balarezo <italic>et al</italic>. 2016</xref>), pero son sólo el 6 % del total.</p>
				<p>Las unidades de producción agrícola (UPA) cuentan con pequeñas instalaciones de ordeño o establos, lo que refleja su limitada capacidad económica (<xref ref-type="bibr" rid="B46">Velasteguí 2019</xref>). En términos de superficie terrestre, existe gran diferencia entre los grupos de productores. Los pequeños agricultores tienen un promedio de 3 ha. Los medianos productores cuentan con 7 ha. Los grandes productores cuentan con 120 ha (<xref ref-type="bibr" rid="B35">Requelme y Bonifaz 2012</xref>).</p>
				<p>La edad promedio de los productores es de 50 años. Esto muestra pocos jóvenes y poco recambio generacional (<xref ref-type="bibr" rid="B25">Moreno 2018</xref>). En términos de educación, 60 % de los productores tiene educación primaria, 25 % tiene educación secundaria y 15 % educación universitaria. La cadena de producción no es competitiva, perjudica la producción y limita el sector agrícola de la región.</p>
				<p>Se utilizan varias herramientas en el mundo para evaluar los factores socioeconómicos (FSE) y analizar estrategias para el desarrollo agrícola y alimentario sostenible (<xref ref-type="bibr" rid="B10">FAO 2018</xref>). Actualmente, la implementación de prácticas de inteligencia artificial (IA) inclusivas y sostenibles en la agricultura proporciona soluciones para lograr la seguridad alimentaria y nutricional. La IA se aplica en la robótica agrícola, el monitoreo de suelos y cultivos, así como para realizar análisis predictivos (<xref ref-type="bibr" rid="B12">FAO 2022b</xref>).</p>
				<p>&quot;Machine Learning&quot; (ML) es el campo de estudio conocido como método o arte científico, donde las computadoras pueden aprender a partir de datos mediante programación (<xref ref-type="bibr" rid="B44">Valdez 2019</xref> y <xref ref-type="bibr" rid="B22">Kassahun <italic>et al</italic>. 2022</xref>). Los datos utilizados para aprender se denominan muestras y forman parte del conjunto de entrenamiento. La parte del sistema ML que aprende y hace predicciones se denomina modelo, que comúnmente se prueba mediante el conjunto de pruebas (<xref ref-type="bibr" rid="B16">Gaurav y Patel 2020</xref> y <xref ref-type="bibr" rid="B38">Slob <italic>et al</italic>. 2021</xref>). El aprendizaje automático es bueno, por ejemplo, en problemas que requieren muchas reglas, entornos fluctuantes y en problemas que requieren descubrir conocimientos en grandes cantidades de datos. </p>
				<p>
					<xref ref-type="bibr" rid="B17">Géron (2019)</xref> propone tres sistemas ML principales: los supervisados durante el entrenamiento, los que pueden aprender incrementalmente sobre la marcha y los que permiten comparar nuevos puntos de datos con puntos de datos conocidos. Los sistemas de aprendizaje automático pueden clasificar datos según los datos de entrenamiento utilizados para aprender el modelo. Esto abre varias categorías, pero este estudio está impulsado por el aprendizaje supervisado, que requiere las soluciones en los datos de entrenamiento, comúnmente llamadas etiquetas. Un ejemplo de este aprendizaje es la clasificación de los correos electrónicos <italic>spam</italic> (<xref ref-type="bibr" rid="B44">Valdez 2019</xref>).</p>
				<p>Para <xref ref-type="bibr" rid="B2">Alwadi <italic>et al.</italic> (2024)</xref>, el clasificador de aumento de gradiente (GBC), usa amplios conjuntos de datos para desarrollar modelos que pronostican la producción y encuentran patrones relevantes. Este método usado en un estudio en Jordania, donde se emplearon sensores para rastrear a 4000 vacas, demostró gran potencial para aumentar la productividad. Asimismo, <xref ref-type="bibr" rid="B3">Bai <italic>et al</italic>. (2022)</xref> mostraron que el GBDT-AdaBoost alcanzó precisión promedio de reconocimiento de 98.0 %, superando a otros modelos como el bosque aleatorio y el árbol extremadamente aleatorio, que tuvieron precisiones de 79.9 % y 71.1 %, respectivamente.</p>
				<p>
					<xref ref-type="bibr" rid="B6">Bovo <italic>et al</italic>. (2021)</xref> mostraron un clasificador de bosque aleatorio (RF) con error de predicción promedio de 18 % para la producción diaria de leche de cada vaca, y solo de 2 % para la producción total. Esto demuestra que el clasificador de bosque aleatorio es eficaz en la calibración de modelos que ayudan a mejorar la sostenibilidad y eficiencia en la ganadería lechera.</p>
				<p>
					<xref ref-type="bibr" rid="B31">Piwczyński <italic>et al</italic>. (2020)</xref> utilizaron un clasificador de árbol de decisión (DT) para identificar los factores que influyen en la alta producción mensual de leche en vacas Holstein-Frisonas en 27 rebaños con robots de ordeño. Los resultados mostraron que la mayor producción mensual (47.24 kg) se registró en vacas multíparas, ordeñadas más de tres veces al día, en establos con lecho profundo. En contraste, la menor producción (13.56 kg) se observó en vacas ordeñadas menos de dos veces al día, con promedio de menos de 3.97 cuartos ordeñados. Este modelo permite a los criadores ajustar los factores para maximizar la producción de leche.</p>
				<p>Finalmente, <xref ref-type="bibr" rid="B9">Fadillah <italic>et al</italic>. (2023)</xref> en un estudio con productores lecheros indonesios sobre la calidad de la leche y los factores asociados con el recuento total en placa (TPC) y el recuento de células somáticas (SCC). Se utilizaron modelos de regresión multinomial y regresión logística de tipo Firth para identificar factores relacionados con el conocimiento de TPC y SCC. Permitieron identificar como variables significativas la pertenencia a cooperativas, la distancia a productores vecinos y la adopción de tecnología para aumentar la conciencia sobre la calidad de la leche entre pequeños productores. En general, tales resultados muestran evidencia de que son modelos aplicables a cualquier región y facilitan la toma de decisiones, basados en resultados con mediciones efectivas.</p>
				<p>Esta investigación comparó cuatro técnicas diferentes de aprendizaje automático: clasificador de aumento de gradiente (GBC), clasificador de bosque aleatorio (RF), clasificador de árbol de decisión (DT) y regresión logística (LR). Los resultados mostraron que GBC y RF fueron las técnicas de aprendizaje automático más efectivas para clasificar la producción de leche.</p>
			</sec>
			<sec sec-type="methods">
				<title>Metodología</title>
				<p>El presente estudio implica un análisis experimental que consta de cuatro fases: preprocesamiento de datos, selección de características, clasificación y análisis comparativo de los clasificadores. </p>
				<p>El flujo de trabajo de la metodología propuesta se muestra en la <xref ref-type="fig" rid="f5">figura 1</xref>, que ilustra las relaciones entre las diferentes fases y la aplicación de algoritmos específicos en cada etapa.</p>
				<p>
					<fig id="f5">
						<label>Figura 1</label>
						<caption>
							<title>Flujo de trabajo para predecir la producción láctea a pequeña escala</title>
						</caption>
						<graphic xlink:href="2079-3480-cjas-59-e01-gf5.svg"/>
						<attrib>Fuente: Elaboración propia</attrib>
					</fig>
				</p>
				<sec>
					<title>Recopilación de datos</title>
					<p>Se encuestó la población de pequeños y medianos productores lecheros de la provincia del Carchi, totalizando 532 individuos. Se empleó un enfoque de investigación aplicada con una metodología exploratoria y correlacional (<xref ref-type="bibr" rid="B19">Hernández-Sampieri y Mendoza 2018</xref>). El cuestionario abordó una variedad de factores, brindando información sobre aspectos relevantes para la comunidad de productores lecheros:</p>
					<p>
						<list list-type="bullet">
							<list-item>
								<p><bold>Social</bold>: edad, género, nivel educativo, estructura familiar, formación, acceso a la tecnología, condiciones de vivienda, servicios básicos, empleo, asociatividad, gobernanza y participación, apoyo técnico gubernamental </p>
							</list-item>
							<list-item>
								<p><bold>Económico</bold>: ingresos ganaderos, otros ingresos, costos de producción, distribución del ingreso, financiamiento, comercialización, tamaño de la finca.</p>
							</list-item>
							<list-item>
								<p><bold>Productivo</bold>: uso de la tierra, tamaño y estructura del rebaño, número de cabezas de ganado, pastos, producción de leche por hectárea (L ha<sup>-1</sup>), adopción de tecnología y diversificación productiva. número de cabezas de ganado.</p>
							</list-item>
						</list>
					</p>
					<p>Se incorporaron 17 preguntas con información cuantitativa, 23 preguntas de intervalo y 10 preguntas dicotómicas. El cuestionario fue desarrollado rigurosamente y se validó su contenido y estructura. La recolección de datos en campo se llevó a cabo en colaboración con estudiantes de Administración de Empresas de la Universidad Politécnica Estatal del Carchi (UPEC), Ecuador, durante el segundo semestre de 2022. Se aplicó un muestreo aleatorio simple.</p>
				</sec>
				<sec>
					<title>Preprocesamiento de datos</title>
					<p>Los datos recopilados se sometieron a un riguroso proceso de preprocesamiento, que incluyó la eliminación de errores y valores atípicos, así como el tratamiento de valores faltantes. Se aplicó la normalización Min-Max para garantizar que todas las características tuvieran un rango común y fueran comparables entre sí (<xref ref-type="bibr" rid="B43">Treviño Cantú 2022</xref>). Esto permitió eliminar cualquier sesgo, debido a la escala de los datos, asegurando un análisis más preciso y justo.</p>
				</sec>
				<sec>
					<title>Selección de características</title>
					<p>La selección de funciones desempeña una función fundamental en la fase de preprocesamiento de datos antes de aplicar las técnicas de aprendizaje automático (<xref ref-type="bibr" rid="B37">Siddiqui y Amer 2024</xref>). Implica seleccionar las características más relevantes e informativas del conjunto de datos, descartando al mismo tiempo las características irrelevantes o redundantes. En este estudio, se utilizó la selección de características para mejorar el rendimiento y la interpretabilidad de los modelos de aprendizaje automático para clasificar los productores lecheros a pequeña escala en la región fronteriza entre Ecuador y Colombia.</p>
					<p>El conjunto de datos utilizado en esta investigación contiene varias variables socioeconómicas y relacionadas con la producción que potencialmente podrían influir en la producción de leche. Sin embargo, no todas estas variables son igualmente importantes para la tarea de predicción. Algunas características pueden introducir ruido, aumentar la carga computacional o provocar un sobreajuste, lo que dificulta la capacidad del modelo para generalizar bien datos invisibles. </p>
					<p>Para abordar estos desafíos e identificar las características más influyentes, se empleó la técnica de eliminación de características recursivas (RFE). Es un método de selección de funciones popular y potente que funciona ajustando recursivamente el modelo de aprendizaje automático, eliminando las funciones menos significativas en cada iteración. El proceso continúa hasta obtener el número deseado de características. La importancia de RFE radica en su capacidad para clasificar características en función de su contribución al rendimiento del modelo, lo que permite centrarse en los atributos más relevantes y descartar los menos informativos (<xref ref-type="bibr" rid="B24">Mannepalli <italic>et al</italic>. 2024</xref>).</p>
					<p>La base de datos inicial constaba de 134 ítems, incluidas variables numéricas, dicotómicas y categóricas. Con el objetivo de reducir la dimensionalidad de los datos y el costo computacional durante el entrenamiento del modelo, se aplicó la selección de características y finalmente se redujo el conjunto a 10 variables. Se incluyeron el tipo de vivienda, el acceso a agua potable y electricidad, la comercialización de leche cruda, las ventas de queso pasteurizado, el uso de leche para la producción de queso, las relaciones con los clientes, el ingreso total anual de la actividad primaria, los litros utilizados para la producción de queso y el precio por litro.</p>
				</sec>
				<sec>
					<title>Algoritmo de clasificación</title>
					<sec>
						<title>Gradient Boosting Classifier (GBC)</title>
						<p>Es un clasificador que destaca por su precisión y velocidad de predicción sobre conjuntos de datos grandes y complejos. También minimiza el error de sesgo del modelo (<xref ref-type="bibr" rid="B5">Bentéjac <italic>et al</italic>. 2020</xref>). Este método se utiliza cuando sólo hay dos clases en las características objetivo, es decir, clases binarias (positivas y negativas). La función de pérdida como log-verosimilitud se utiliza en la creación (entrenamiento) del modelo (<xref ref-type="bibr" rid="B28">Natekin y Knoll 2013</xref>). Esta pérdida se muestra en la <xref ref-type="disp-formula" rid="e5">ecuación (1)</xref>:</p>
						<p>
							<disp-formula id="e5">
								<mml:math>
									<mml:mrow>
										<mml:mi>L</mml:mi>
										<mml:mfenced>
											<mml:mi>θ</mml:mi>
										</mml:mfenced>
										<mml:mo>=</mml:mo>
										<mml:mo>−</mml:mo>
										<mml:mo>∑</mml:mo>
										<mml:msub>
											<mml:mi>y</mml:mi>
											<mml:mi>i</mml:mi>
										</mml:msub>
										<mml:mi>log</mml:mi>
										<mml:mo stretchy="false">(</mml:mo>
										<mml:mi>p</mml:mi>
										<mml:mo stretchy="false">(</mml:mo>
										<mml:msub>
											<mml:mi>y</mml:mi>
											<mml:mi>i</mml:mi>
										</mml:msub>
										<mml:mo>|</mml:mo>
										<mml:msub>
											<mml:mi>x</mml:mi>
											<mml:mi>i</mml:mi>
										</mml:msub>
										<mml:mo>;</mml:mo>
										<mml:mi>θ</mml:mi>
										<mml:mo stretchy="false">)</mml:mo>
										<mml:mo stretchy="false">)</mml:mo>
									</mml:mrow>
								</mml:math>
								<label>(1)</label>
							</disp-formula>
						</p>
						<p>donde <mml:math>
								<mml:mrow>
									<mml:msub>
										<mml:mi>y</mml:mi>
										<mml:mi>i</mml:mi>
									</mml:msub>
								</mml:mrow>
							</mml:math> es el objetivo de clasificación, <mml:math>
								<mml:mi>p</mml:mi>
							</mml:math> es la probabilidad prevista de clase 1 y <mml:math>
								<mml:mi>θ</mml:mi>
							</mml:math> es la entrada.</p>
						<p>La función de pérdida encuentra los residuos después de crear el árbol de decisión con todas las variables independientes y objetivo. Cuando se construye el primer árbol, la salida final se encuentra por las hojas (<xref ref-type="bibr" rid="B36">Saini 2021</xref>). La fórmula directa para calcular el resultado final se muestra en la <xref ref-type="disp-formula" rid="e6">ecuación (2)</xref>:</p>
						<p>
							<disp-formula id="e6">
								<mml:math>
									<mml:mrow>
										<mml:mstyle mathsize="normal" mathvariant="bold">
											<mml:mi>γ</mml:mi>
										</mml:mstyle>
										<mml:mo>=</mml:mo>
										<mml:mfrac>
											<mml:mrow>
												<mml:msubsup>
													<mml:mstyle displaystyle="true" mathsize="140%">
														<mml:mo>∑</mml:mo>
													</mml:mstyle>
													<mml:mrow>
														<mml:mi>i</mml:mi>
														<mml:mo>=</mml:mo>
														<mml:mn>1</mml:mn>
													</mml:mrow>
													<mml:mi>n</mml:mi>
												</mml:msubsup>
												<mml:mi>R</mml:mi>
												<mml:mi>e</mml:mi>
												<mml:mi>s</mml:mi>
												<mml:mi>i</mml:mi>
												<mml:mi>d</mml:mi>
												<mml:mi>u</mml:mi>
												<mml:mi>a</mml:mi>
												<mml:msub>
													<mml:mi>l</mml:mi>
													<mml:mi>i</mml:mi>
												</mml:msub>
											</mml:mrow>
											<mml:mrow>
												<mml:msubsup>
													<mml:mstyle displaystyle="true" mathsize="140%">
														<mml:mo>∑</mml:mo>
													</mml:mstyle>
													<mml:mrow>
														<mml:mi>i</mml:mi>
														<mml:mo>=</mml:mo>
														<mml:mn>1</mml:mn>
													</mml:mrow>
													<mml:mi>n</mml:mi>
												</mml:msubsup>
												<mml:mfenced close="]" open="[">
													<mml:mrow>
														<mml:mi>P</mml:mi>
														<mml:mi>r</mml:mi>
														<mml:mi>e</mml:mi>
														<mml:mi>v</mml:mi>
														<mml:mi>i</mml:mi>
														<mml:mi>o</mml:mi>
														<mml:mi>u</mml:mi>
														<mml:mi>s</mml:mi>
														<mml:mo> </mml:mo>
														<mml:mi>p</mml:mi>
														<mml:mi>r</mml:mi>
														<mml:mi>o</mml:mi>
														<mml:mi>b</mml:mi>
														<mml:mi>a</mml:mi>
														<mml:mi>b</mml:mi>
														<mml:mi>i</mml:mi>
														<mml:mi>l</mml:mi>
														<mml:mi>i</mml:mi>
														<mml:mi>t</mml:mi>
														<mml:msub>
															<mml:mi>y</mml:mi>
															<mml:mi>i</mml:mi>
														</mml:msub>
														<mml:mo>×</mml:mo>
														<mml:mfenced>
															<mml:mrow>
																<mml:mn>1</mml:mn>
																<mml:mo>−</mml:mo>
																<mml:mi>P</mml:mi>
																<mml:mi>r</mml:mi>
																<mml:mi>e</mml:mi>
																<mml:mi>v</mml:mi>
																<mml:mi>i</mml:mi>
																<mml:mi>o</mml:mi>
																<mml:mi>u</mml:mi>
																<mml:mi>s</mml:mi>
																<mml:mo> </mml:mo>
																<mml:mi>p</mml:mi>
																<mml:mi>r</mml:mi>
																<mml:mi>o</mml:mi>
																<mml:mi>b</mml:mi>
																<mml:mi>a</mml:mi>
																<mml:mi>b</mml:mi>
																<mml:mi>i</mml:mi>
																<mml:mi>l</mml:mi>
																<mml:mi>i</mml:mi>
																<mml:mi>t</mml:mi>
																<mml:msub>
																	<mml:mi>y</mml:mi>
																	<mml:mi>i</mml:mi>
																</mml:msub>
															</mml:mrow>
														</mml:mfenced>
													</mml:mrow>
												</mml:mfenced>
											</mml:mrow>
										</mml:mfrac>
									</mml:mrow>
								</mml:math>
								<label>(2)</label>
							</disp-formula>
						</p>
						<p>donde <mml:math>
								<mml:mi>Y</mml:mi>
							</mml:math> es la función objetivo para la decisión de clasificación. </p>
					</sec>
					<sec>
						<title>Clasificador de bosque aleatorio (RF)</title>
						<p>Se denomina bosque de árbol de decisión. Este método se basa en el principio de ensacado con selección aleatoria de características y el modelo utiliza votación para combinar predicciones de árboles. RF funciona bien para la mayoría de los problemas, puede manejar el ruido y selecciona solo las funciones más importantes. Sin embargo, la interpretabilidad del modelo es limitada y su ajuste requiere cierto esfuerzo en el manejo de los datos (<xref ref-type="bibr" rid="B16">Gaurav y Patel 2020</xref>).</p>
					</sec>
					<sec>
						<title>Clasificador de árbol de decisión (DT)</title>
						<p>Es un algoritmo de aprendizaje automático supervisado que se puede utilizar para categorización o predicción. Los DT están diseñados para imitar el pensamiento humano, lo que hace que los resultados sean fáciles de entender e interpretar. Los seis componentes clave de un DT son el nodo raíz, la división, el nodo de decisión, el nodo hoja, la poda y la rama (<xref ref-type="bibr" rid="B39">Suthaharan 2016</xref>).</p>
						<p>Los DT se utilizan en problemas que involucran datos y variables, numéricos como categóricos. Son eficaces para modelar problemas con múltiples resultados y para probar la confiabilidad de los árboles. Otra ventaja de los DT es que requieren menos limpieza de datos en comparación con otras técnicas de modelado de datos. Sin embargo, es importante reconocer que los DT se pueden ver afectados por el ruido y pueden no ser ideales para conjuntos de datos más grandes (<xref ref-type="bibr" rid="B23">Kliś <italic>et al</italic>. 2021</xref>).</p>
					</sec>
					<sec>
						<title>Regresión logística (LR)</title>
						<p>También llamada regresión logit, se utiliza para estimar la probabilidad de que una instancia pertenezca a una clase determinada. Normalmente, se utiliza para tareas de clasificación binaria donde las clases se etiquetan como 0 y 1, según un umbral de probabilidad (<xref ref-type="bibr" rid="B17">Géron 2019</xref>). La probabilidad estimada de LR se presenta en la <xref ref-type="disp-formula" rid="e7">ecuación (3)</xref>:</p>
						<p>
							<disp-formula id="e7">
								<mml:math>
									<mml:mrow>
										<mml:mover accent="true">
											<mml:mi>p</mml:mi>
											<mml:mo>^</mml:mo>
										</mml:mover>
										<mml:mo>=</mml:mo>
										<mml:msub>
											<mml:mi>h</mml:mi>
											<mml:mi>θ</mml:mi>
										</mml:msub>
										<mml:mfenced>
											<mml:mstyle mathsize="normal" mathvariant="bold">
												<mml:mi>x</mml:mi>
											</mml:mstyle>
										</mml:mfenced>
										<mml:mo>=</mml:mo>
										<mml:mstyle mathsize="normal" mathvariant="bold">
											<mml:mi>σ</mml:mi>
										</mml:mstyle>
										<mml:mfenced>
											<mml:mrow>
												<mml:msup>
													<mml:mi>θ</mml:mi>
													<mml:mi>t</mml:mi>
												</mml:msup>
												<mml:mi>⋅</mml:mi>
												<mml:mstyle mathsize="normal" mathvariant="bold">
													<mml:mi>x</mml:mi>
												</mml:mstyle>
											</mml:mrow>
										</mml:mfenced>
									</mml:mrow>
								</mml:math>
								<label>(3)</label>
							</disp-formula>
						</p>
						<p>donde σ (t) es una función sigmoidea que produce un número entre 0 y 1, dado por la función logística que se muestra en la <xref ref-type="disp-formula" rid="e8">ecuación (4)</xref>:</p>
						<p>
							<disp-formula id="e8">
								<mml:math>
									<mml:mrow>
										<mml:mstyle mathsize="normal" mathvariant="bold">
											<mml:mi>σ</mml:mi>
										</mml:mstyle>
										<mml:mfenced>
											<mml:mstyle mathsize="normal" mathvariant="bold">
												<mml:mi>t</mml:mi>
											</mml:mstyle>
										</mml:mfenced>
										<mml:mo>=</mml:mo>
										<mml:mfrac>
											<mml:mn>1</mml:mn>
											<mml:mrow>
												<mml:mn>1</mml:mn>
												<mml:mo>+</mml:mo>
												<mml:msup>
													<mml:mi>e</mml:mi>
													<mml:mrow>
														<mml:mo>−</mml:mo>
														<mml:mi>t</mml:mi>
													</mml:mrow>
												</mml:msup>
											</mml:mrow>
										</mml:mfrac>
									</mml:mrow>
								</mml:math>
								<label>(4)</label>
							</disp-formula>
						</p>
						<p>donde <mml:math>
								<mml:mi>t</mml:mi>
							</mml:math> es el tiempo</p>
						<p>La evaluación de los modelos de aprendizaje automático se describe a continuación:</p>
						<p>
							<list list-type="bullet">
								<list-item>
									<p><italic>Precisión o Proximidad de los resultados</italic>: Utiliza los parámetros verdadero positivo (TP), verdadero negativo (TN), falso positivo (FP), falso negativo (FN).</p>
								</list-item>
								<list-item>
									<p><italic>El área bajo la curva (AUC)</italic>: Mide la capacidad del modelo para discriminar entre dos clases.</p>
								</list-item>
								<list-item>
									<p><italic>Recuerdo o probabilidad de clasificar verdaderos positivos</italic>: Utiliza los parámetros verdadero positivo (TP), falso negativo (FN).</p>
								</list-item>
								<list-item>
									<p><italic>Precisión o dispersión del conjunto de valores obtenidos</italic>: Utiliza los parámetros verdadero positivo (TP), falso positivo (FP).</p>
								</list-item>
								<list-item>
									<p><italic>F1 (F-Score)</italic>: Combina medidas de precisión y recuperación en un solo valor.</p>
								</list-item>
								<list-item>
									<p><italic>Kappa</italic> cuantifica la concordancia entre las predicciones realizadas por un modelo y las clases verdaderas. Se utiliza para evaluar el rendimiento predictivo de diferentes clases.</p>
								</list-item>
								<list-item>
									<p>El tiempo de entrenamiento (TE Seg) mide el tiempo que tarda un modelo en aprender del conjunto de datos de entrenamiento y ajustar sus parámetros para obtener predicciones precisas.</p>
								</list-item>
							</list>
						</p>
					</sec>
				</sec>
			</sec>
			<sec sec-type="results|discussion">
				<title>Resultados y Discusión</title>
				<p>La preparación de algoritmos de aprendizaje automático, incluida la selección de funciones y el entrenamiento de modelos, se realizó utilizando una combinación de herramientas de ciencia de datos de última generación. El código utilizado para este propósito, basado en las bibliotecas 'pycaret' y 'scikit-learn' en Python, formó la piedra angular del enfoque metodológico.</p>
				<p>La implementación del modelo utilizando funciones estándar de 'scikit-learn' proporcionó una base sólida para el proceso de capacitación. En este estudio, se omitió intencionalmente el ajuste de hiperparámetros, basándose en su lugar en los parámetros predeterminados inherentes a cada modelo. Esta elección estratégica se hizo para mantener la coherencia metodológica y facilitar las comparaciones directas entre modelos. La adopción de configuraciones predeterminadas inherentes a cada algoritmo tenía como objetivo mantener un marco estandarizado en todos los análisis, garantizando la transparencia y reproducibilidad de los experimentos.</p>
				<p>El mejor modelo entrenado con el conjunto de datos discutido anteriormente fue GBC, que logró 96.77 % de predicciones correctas en la fase de prueba. Adicionalmente, el porcentaje de la habilidad de evaluación predictiva del modelo entrenado fue de 96.9 %, y en la evaluación del desempeño alcanzó 93.50 %. También se midieron otras métricas importantes como AUC, recuperación y precisión, que obtuvieron 99.4, 97.90 y 96.10 %, respectivamente. Asimismo, las métricas para modelos como RF, DT y LR se presentan en la <xref ref-type="table" rid="t2">tabla 1</xref>.</p>
				<p>
					<table-wrap id="t2">
						<label>Tabla 1</label>
						<caption>
							<title>Resultados de los algoritmos de clasificación</title>
						</caption>
						<table>
							<colgroup>
								<col/>
								<col/>
								<col/>
								<col/>
								<col/>
								<col/>
								<col/>
								<col/>
							</colgroup>
							<thead>
								<tr>
									<th align="left">Algoritmo</th>
									<th align="center">Exactitud, %</th>
									<th align="center">AUC, %</th>
									<th align="center">Recordar, %</th>
									<th align="center">Prec, %</th>
									<th align="center">F1, %</th>
									<th align="center">Kappa, %</th>
									<th align="center">TT, seg.</th>
								</tr>
							</thead>
							<tbody>
								<tr>
									<td align="left">GBC</td>
									<td align="center">0.9677</td>
									<td align="center">0.994</td>
									<td align="center">0,979</td>
									<td align="center">0.961</td>
									<td align="center">0.969</td>
									<td align="center">0.935</td>
									<td align="center">0.90</td>
								</tr>
								<tr>
									<td align="left">RF</td>
									<td align="center">0.9518</td>
									<td align="center">0.984</td>
									<td align="center">0.964</td>
									<td align="center">0.946</td>
									<td align="center">0.954</td>
									<td align="center">0.903</td>
									<td align="center">1.00</td>
								</tr>
								<tr>
									<td align="left">DT</td>
									<td align="center">0.9489</td>
									<td align="center">0.956</td>
									<td align="center">0.943</td>
									<td align="center">0.96</td>
									<td align="center">0.95</td>
									<td align="center">0.898</td>
									<td align="center">0.63</td>
								</tr>
								<tr>
									<td align="left">LR</td>
									<td align="center">0.9141</td>
									<td align="center">0.977</td>
									<td align="center">0.948</td>
									<td align="center">0.894</td>
									<td align="center">0.919</td>
									<td align="center">0.828</td>
									<td align="center">0.77</td>
								</tr>
							</tbody>
						</table>
					</table-wrap>
				</p>
				<p>En este estudio, se midió el tiempo de entrenamiento de los modelos. En GBC, la capacitación duró aproximadamente 0.9 segundos. RF, DT y LR en su entrenamiento lograron 1, 0.63 y 0.77 segundos respectivamente. Estos resultados y la precisión de cada modelo se muestran en la <xref ref-type="fig" rid="f6">figura 2</xref>.</p>
				<p>
					<fig id="f6">
						<label>Figura 2</label>
						<caption>
							<title>Precisión y tiempo de ejecución de los algoritmos de aprendizaje automático mejor valorados</title>
						</caption>
						<graphic xlink:href="2079-3480-cjas-59-e01-gf6.svg"/>
					</fig>
				</p>
				<p>Una fase esencial en la formación del mejor modelo fue la importancia de las características. El modelo GBC, que es el mejor, encontró que la característica correspondiente a “ingreso principal” tuvo una métrica del 80 %. La importancia de las características se presenta en la <xref ref-type="fig" rid="f7">figura 3</xref>.</p>
				<p>
					<fig id="f7">
						<label>Figura 3</label>
						<caption>
							<title>Características importantes del modelo GBC</title>
						</caption>
						<graphic xlink:href="2079-3480-cjas-59-e01-gf7.svg"/>
					</fig>
				</p>
				<p>La <xref ref-type="fig" rid="f8">figura 4</xref> muestra la matriz de predicción y los cuadros superior izquierdo e inferior derecho corresponden a las predicciones correctas, mientras que los cuadros superior derecho e inferior izquierdo contienen predicciones incorrectas o falsos positivos.</p>
				<p>
					<fig id="f8">
						<label>Figura 4</label>
						<caption>
							<title>Matriz de confusión del mejor modelo de clasificación.</title>
						</caption>
						<graphic xlink:href="2079-3480-cjas-59-e01-gf8.svg"/>
					</fig>
				</p>
				<p>
					<xref ref-type="bibr" rid="B29">Nyambo <italic>et al</italic>. (2023)</xref> aplicaron técnicas de aprendizaje automático (ML) en la industria láctea de Tanzania. Su estudio se centró en tres cuestiones principales: infraestructura inadecuada, tecnología obsoleta y baja productividad. Analizaron los datos y encontraron grupos de producción homogéneos. Luego, hicieron recomendaciones para aumentar la producción de leche. De manera similar, <xref ref-type="bibr" rid="B27">Mwanga <italic>et al</italic>. (2020)</xref> utilizaron ML para identificar grupos de agricultores. En su caso, la clasificación se basó en la ubicación de la finca. También se basó en el sistema de alimentación y cuidado de los animales. Esta información favoreció mejor planificación y gestión de recursos. Permitió intervenciones más precisas en cada grupo para mejorar los servicios.</p>
				<p>Autores como <xref ref-type="bibr" rid="B1">Abdukarimova <italic>et al</italic>. (2016)</xref> mencionan que estimar la producción de leche ayuda a evaluar el desempeño de la producción y es necesario para una gestión eficiente de los recursos. Sin embargo, existen varios desafíos asociados con la previsión de la producción de leche, especialmente en la clasificación eficaz.</p>
				<p>
					<xref ref-type="bibr" rid="B21">Ji <italic>et al</italic>. (2022)</xref> ejecutaron un marco de aprendizaje automático con la utilización de cinco años de datos de productividad y salud conductual de 80 vacas. Lograron una precisión de más de 80 %. Otros autores como <xref ref-type="bibr" rid="B34">Radwan <italic>et al</italic>. (2020)</xref> han propuesto un modelo lineal dinámico (DLM) y una red neuronal artificial (RNA) en la predicción de la producción de leche. El DLM logró precisión de 95 %, utilizando un conjunto de datos que constaba de 1094780 observaciones de información de sensores proporcionados por Lely Industries (Masslui, Países Bajos). La RNA logró precisión del 79.5 %, superando las expectativas de producción de leche.</p>
				<p>A pesar de los desafíos involucrados, este trabajo comparó diferentes modelos de aprendizaje automático (GBC, RF, DT, LR) en un conjunto de datos de producción de leche de Carchi, provincia de Ecuador. Los resultados mostraron precisión de clasificación significativa: GBC logró una precisión del 96.77 % y recuperación del 97.9 %. RF logró precisión de 95.18 % y puntuación F1 de 95.4 %.</p>
				<p>La abundancia de datos en el sector ganadero requiere enfoques de análisis innovadores. Este estudio investigó el potencial de los modelos de aprendizaje profundo, específicamente seis algoritmos de redes neuronales, como alternativa a los métodos estadísticos tradicionales. En comparación con estos métodos tradicionales, los modelos de aprendizaje profundo pueden lograr una mayor precisión, lo que los convierte en herramientas valiosas para identificar variables agrícolas y desarrollar productos lácteos seguros, y prácticas de gestión de riesgos (<xref ref-type="bibr" rid="B40">Suseendran y Duraisamy 2021</xref>).</p>
				<p>Los investigadores utilizaron métodos de clasificación para identificar variables relevantes, y luego emplearon estas variables para entrenar varios modelos predictivos. Estos modelos incluían no solo algoritmos de aprendizaje profundo, sino también establecidas como regresión logística, k vecinos más cercanos, árboles de decisión y bosques aleatorios. Si bien la mayoría de los modelos lograron un alto rendimiento predictivo de 93 %, las redes neuronales y los modelos de mezcla gaussiana demostraron ser más sensibles a las variaciones en el conjunto de datos. En respuesta, los investigadores combinaron algoritmos de bosque aleatorio y de árbol de decisión para mejorar la selección de factores (<xref ref-type="bibr" rid="B27">Mwanga <italic>et al</italic>. 2020</xref>).</p>
				<p>Los resultados de la encuesta mostraron que el principal ingreso económico derivado de la producción de leche (89 %), el precio por litro de leche (46 %) y la cantidad de litros de leche utilizados para la producción de queso (18 %) fueron los factores más importantes en la producción. También tuvieron un impacto significativo la presencia de un hijo como sustento económico del hogar (5 %), el destino de la leche para la producción y venta de queso (21 %) y el uso de la producción de leche y queso para el consumo doméstico (53 %), pero en menor medida.</p>
				<p>El estudio describe los FSE clave que dan forma a la dinámica familiar y la producción agrícola en la comunidad estudiada. Se destaca que el 90 % de los productores que mantienen condiciones adecuadas del hogar, el nivel educativo no muestra influencias en las decisiones de bienestar familiar. Sin embargo, el nivel educativo universitario con que cuentan algunos productores señala la presencia de mayores ingresos y mejores tasas de producción. Además, prevalece un modelo patriarcal de sostén de familia, en el que los maridos asumen esta función en 75 % de los hogares. La edad también emerge como un factor. Se observó aumento de la convivencia entre los 50 y 55 años. Además, la experiencia se entrelaza con la educación, ya que ambas tienen un impacto significativo en los niveles de producción. Estos hallazgos subrayan la compleja interacción entre educación, ingresos, estructura del hogar y productividad agrícola y brindan información valiosa para la elaboración de modelos socioeconómicos y estrategias de desarrollo. </p>
				<p>El estudio sugiere mayor exploración a través de un análisis de eficiencia técnica productiva, que incluiría variables como infraestructura, mano de obra, manejo de productos, procesos de ordeño, manejo, prácticas ambientales y control de calidad. Un análisis de este tipo permitiría optimizar las capacidades de producción en una unidad de producción. De esto se pueden derivar intervenciones específicas para mejorar la eficiencia de la producción, facilitar el acceso justo a los mercados y racionalizar las actividades de procesamiento de lácteos con valor agregado.</p>
			</sec>
			<sec sec-type="conclusions">
				<title>Conclusiones</title>
				<p>Este estudio ha identificado los factores que influyen en la producción en pequeñas explotaciones lecheras en la región fronteriza entre Ecuador y Colombia. Los resultados de este estudio se pueden utilizar para informar futuras investigaciones y decisiones destinadas a apoyar la sostenibilidad y el desarrollo del sector lácteo en la región. Al arrojar luz sobre los determinantes clave de la producción de leche y su impacto en el bienestar económico de las familias rurales, esta investigación proporciona una guía valiosa para las partes interesadas y los responsables para formulación de intervenciones e iniciativas específicas.</p>
				<p>Este estudio, en el contexto único de la zona fronteriza ecuatoriana, destaca el potencial de las técnicas de aprendizaje automático para clasificar con precisión la producción de leche de los pequeños agricultores. La aplicación exitosa de algoritmos de aprendizaje automático, incluidos Gradient Boosting Classifier y Random Forest, ha demostrado su eficacia para clasificar la producción de leche con una precisión notable. </p>
				<p>Los resultados de este estudio tienen implicaciones significativas para la industria láctea en la región fronteriza entre Ecuador y Colombia, y más allá. Los factores identificados que influyen en la producción de leche proporcionan una hoja de ruta para mejorar la productividad y los medios de vida en las comunidades de productores lecheros de pequeña escala.</p>
				<p>A medida que el sector lácteo continúa desempeñando un papel fundamental en la economía de la región, aprovechar el poder del aprendizaje automático para identificar variables relevantes será fundamental para dar forma a los modelos predictivos, promover el crecimiento sostenible y fortalecer el bienestar económico general del sector.</p>
			</sec>
		</body>
	</sub-article>
</article>