<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Article Authoring DTD v1.4 20240229//EN" "JATS-articleauthoring1.dtd">
<article article-type="research-article" xml:lang="zh-CN" xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">11</journal-id>
      <journal-title-group>
        <journal-title>现代教育论坛</journal-title>
      </journal-title-group>
      <issn>ISSN:3081-0868</issn>
      <publisher>
        <publisher-name>华文科学出版社（HUAWEN SCIENCE PRESS）</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="publisher-id">26907</article-id>
      <title-group>
        <article-title>基于Kaggle数据集的线性回归房价预测及特征有效性分析</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>舒彝军 唐梦蛟*（通讯作者） 林醒尘 （成都轻工职业技术大学）</string-name>
        </contrib>
      </contrib-group>
      <pub-date pub-type="epub">
        <year>2026</year>
        <month>2</month>
      </pub-date>
      <issue>2</issue>
      <abstract>
        <p>为识别房价关键影响因素并提升预测性能，本文基于 Kaggle 房价数据集，利用线性回归开展房价预测与特征
分析。通过缺失值处理、标准化与独热编码完成数据预处理并构建高维特征空间[1]，依据回归权重系数量化特征重要性并筛
选核心特征[2]，结合精简特征集与 K 折交叉验证实现模型训练与评估[3]。结果显示，居住面积、装修质量、车库容量、房龄
及区位条件为房价核心影响因子；特征筛选可在简化模型结构的同时提升泛化能力，证明了该策略的有效性。研究可为房价
预测、影响因素分析及轻量化建模提供参考。</p>
      </abstract>
    </article-meta>
  </front>
</article>
