福利一区二区三区视频在线观看-福利一区三区-福利一区视频-福利在线网址-妇女激情毛片-干干干操操操

您現在的位置: 首頁 > 技術轉讓 > 一種基于分布漂移數據集的特征選擇方法

一種基于分布漂移數據集的特征選擇方法

  • 專利類型:發明專利
  • 有效期:不限
  • 發布日期:2022-09-10
  • 技術成熟度:詳情咨詢
交易價格: ¥面議
  • 法律狀態核實
  • 簽署交易協議
  • 代辦官方過戶
  • 交易成功

專利推薦

  • 技術(專利)類型 發明專利
  • 申請號/專利號 CN201610056798.0 
  • 技術(專利)名稱 一種基于分布漂移數據集的特征選擇方法 
  • 項目單位 上海晶贊科技發展有限公司
  • 發明人 湯奇峰,薛守輝 
  • 行業類別 醫療器械-病房護理設備
  • 技術成熟度 詳情咨詢
  • 交易價格 ¥面議
  • 聯系人 馮君山
  • 發布時間 2022-09-10  
  • 01

    項目簡介

    一種基于分布漂移數據集的特征選擇算法,具體包括過濾器和包裝器兩種版本,該算法通過引入特征泛化有效性分數(FGES)解決特征漂移問題,在給定數據集D、特征候選集F、需要選的特征數量N的設定下,可以產出對分類問題最有效的前N個特征及其排序。本發明使機器學習分類算法面對分布漂移數據集時,仍然可以使用過濾器和包裝器類方法進行特征選擇,進而提高機器學習分類算法運行效率、可擴展性和模型效果。
    展開
  • 02

    說明書

    1.一種基于分布漂移數據集的特征選擇方法,其特征在于,是一種過濾器特征選擇方
    法,包括以下步驟:
    步驟1,給定數據集D,特征候選集合F,需要選擇的特征數量N;
    步驟2,計算特征候選集合F中每個特征的特征相關度分數FRS;其中,所述特征相關度
    分數FRS是指特征與標簽之間的相關程度或重要程度;
    步驟3,計算特征候選集合F中每個特征的特征漂移程度分數FSS;其中,所述特征漂移
    程度分數FSS是指特征分布隨時間變化的程度或者特征標簽組合隨著時間變化的程度;
    步驟4,計算特征候選集合F中每個特征的特征泛化能力有效性分數FGES;其中,所述特
    征泛化能力有效性分數FGES為一種特征評價指標,FGES=g(FRS,FSS),其中g為FRS的非減
    函數,且為FSS的非增函數;其計算綜合了所述特征相關度分數FRS和所述特征漂移程度分
    數FSS;
    步驟5,將特征候選集合F的所有特征根據特征泛化能力有效性分數從大到小排序,得
    到特征排序列表;
    步驟6,根據步驟5的特征排序列表,選出特征排序列表的前N個特征,作為最終的特征
    排序列表。
    2.一種基于分布漂移數據集的特征選擇方法,其特征在于,是一種包裝器特征選擇方
    法,包括以下步驟:
    步驟1,給定機器學習模型M,給定數據集D、特征候選集合F,需要初選的特征數量N;
    步驟2,計算特征候選集合F中每個特征的特征相關度分數FRS;其中,所述特征相關度
    分數FRS是指特征與標簽之間的相關程度或重要程度;
    步驟3,計算特征候選集合F中每個特征的特征漂移程度分數FSS;其中,所述特征漂移
    程度分數FSS是指特征分布隨時間變化的程度或者特征標簽組合隨著時間變化的程度;
    步驟4,計算特征候選集合F中每個特征的特征泛化能力有效性分數FGES;其中,所述特
    征泛化能力有效性分數FGES為一種特征評價指標,FGES=g(FRS,FSS),其中g為FRS的非減
    函數,且為FSS的非增函數;其計算綜合了所述特征相關度分數FRS和所述特征漂移程度分
    數FSS;
    步驟5,將特征候選集合F的所有特征根據特征泛化能力有效性分數從大到小排序,得
    到特征排序列表;
    步驟6,根據步驟5的特征排序列表,選出特征排序列表的前N個特征,作為初選特征排
    序列表;
    步驟7,根據步驟6產生的初選特征排序列表,從前往后依次加入每個特征,依次形成N
    個特征子集,對每個特征子集訓練機器學習模型M的評估效果;
    步驟8,當機器學習模型M的效果達到要求或者N個特征都完成循環后,選出表現最好的
    機器學習模型M對應的特征子集。
    3.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征相關度分數FRS的計算方法為:互信息方法,具體方法為:根據數據集D計算特征候
    選集合F中的每個特征的特征與標簽的互信息,采用特征與標簽的互信息作為每個特征的
    特征相關度分數FRS。
    4.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征相關度分數FRS的計算方法為:分類指標方法,具體方法為:根據數據集D,通過包
    裝器算法計算得出特征候選集合F中的每個特征的AUC指標或分類錯誤率,采用AUC指標或
    分類錯誤率作為每個特征的特征相關度分數FRS。
    5.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征漂移程度分數FSS通過以下方法計算:特征分布KL距離方法,具體方法為:從數據
    集D中取出不重疊時間范圍的兩個子集D1和D2,對應的某特征f的分布分別為s1和s2,則FSS
    (f)=KL(s1,s2)。
    6.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征漂移程度分數FSS通過以下方法計算:特征標簽聯合分布KL距離方法,具體方法
    為:從數據集D中取出不重疊時間范圍的兩個子集D1和D2,D1和D2中的正例中特征f的分布
    分別為ps1,ps2,負例中特征f的分布分別為ns1,ns2,根據需要設定正、負例加權系數分別
    為pw和nw,則FSS=pw*KL(ps1,ps2)+nw*KL(ns1,ns2),取pw=nw=0.5。
    7.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征漂移程度分數FSS通過以下方法計算:特征統計量變化率方法,具體方法為:從數
    據集D中取出不重疊時間范圍的兩個子集D1和D2,分別計算這兩個數據子集的某特征f的均
    值和方差,均值分別為v1、v2,方差分別為u1、u2,則FSS(f)=w1*abs(v2-v1)/abs(v1)+w2*
    abs(u2-u1)/abs(u1),其中,abs表示絕對值,abs(v2-v1)/abs(v1)為均值的相對變化率,
    abs(u2-u1)/abs(u1)為方差的相對變化率,w1和w2分別為均值和方差的加權系數,取w1=
    w2=0.5。
    8.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征漂移程度分數FSS通過以下方法計算:特征標簽統計量變化率方法,具體方法為:
    從數據集D中取出不重疊時間范圍的兩個子集D1和D2,D1和D2中正例中某特征f的均值分別
    為pv1、pv2,方差分別為pu1、pu2,負例的均值分別為nv1、nv2,方差分別為nu1、nu2,則FSS
    (f)=pw*(vw*abs(pv2-pv1)/abs(pv1)+uw*abs(pu2-pu1)/abs(pu1))+nw*abs(vw*abs
    (nv2-nv1)/abs(nv1)+uw*abs(nu2-nu1)/abs(nu1)),其中,abs表示絕對值,pw和nw分別為
    正、負例的加權系數,vw和uw分別為均值和方差的加權系數,取pw=nw=0.5,vw=uw=0.5。
    9.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征泛化能力有效性分數FGES的計算公式為:FGES=FRS/FSS。
    10.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征泛化能力有效性分數FGES的計算公式為:FGES=log(FRS)/log(FSS)。
    11.根據權利要求1或2所述的一種基于分布漂移數據集的特征選擇方法,其特征在于,
    所述特征泛化能力有效性分數FGES的計算公式為:FGES=(1/rank(FRS))*(1/rrank
    (FSS));其中,rank為特征在特征候選集合F中根據某一指標按順序排序的序號;rrank為特
    征在特征候選集合F中根據某一指標按逆序排序的序號,序號從1開始。
    展開

專利技術附圖

服務流程

過戶資料

  • 買賣雙方需提供資料
  • 平臺提供
  • 過戶后您將獲得
  • 買家
  • 賣家
  • 公司
  • 企業營業執照
  • 企業營業執照

    專利注冊證原件

  • 個人
  • 身份證

    個體戶營業執照

  • 身份證

    專利注冊證原件

  • 專利代理委托書

    轉讓申請書

    轉讓協議

  • 手續合格通知書

    專利證書

    專利利登記簿副本

安全保障

  • 品類齊全

    海量資源庫,平臺整合幾十萬閑置資源。
  • 交易保障

    完善的資金保障體系確保買賣雙方資金安全。
  • 專人跟進

    專業交易顧問全程服跟進,確保交易流暢。
  • 快速響應

    專業在線/電話客服服務,快速響應貼心服務。
  • 售后無憂

    資質過硬,國內大知識產權服務平臺。
  • -我要咨詢-
  • ×
聯系人:
專利名稱: *
聯系電話: *
驗證碼:

提交

關于我們 | 聯系我們

傳真:0435-3213171 電話:18801213919 郵箱:[email protected] 地址:吉林省通化市東昌區新華大街1003號(通化市科技成果轉化中心)


舉報電話:0435-5112631     舉報郵箱:[email protected]

備案號ICP備18003140號-1
主站蜘蛛池模板: 91免费在线影院 | 欧美日韩国产另类图片区 | 人妻熟女视频一区二二区 | www.中文字幕日本 | 91久久综合精品国产丝袜长腿 | 一级做a爱无码性色永久免费 | 国产福利电影一区二区三区亚洲国产精 | 伊人色综合久久天天伊人 | 成人h动漫精品一区二区无码 | 国产成人精品免高潮在线观看 | 久久综合经典国产二区无码 | av成人免费在线播放 | 成人国内精品视频在线观看 | 国产成人亚洲综合一区 | 国产av综合第一页一个的一区免费影院黑人 | 国产911视频在线 | 欧美国产成人久久精品 | 99久久精品免费看国产电影 | 国产中文字精品久在线不 | 国产成人精选在线不卡 | 91欧美激情一区二区三区成人 | 亚洲国产精品免费视频 | 国产亚洲999精品AA片在线爽 | 中文字幕无码乱人伦一区二区三区 | 免费的中国黄网站大全 | 日本一道本不卡免费播放 | 国产高清精品在线91 | 精品人妻伦九区久久aaa片69 | 在线看国产一区二区三区 | 无套内谢大学处破女 | 国产精品午夜福利小视频 | 日本一本道高清无码dvd在线观看 | 秋霞成人午夜鲁丝一区二区三区 | 2025最新国产精品网站 | 久久久精品免费热线观看 | 日日摸夜夜添夜夜添一区二区 | 精品久久久中 | 中文字幕亚洲乱码熟 | 国产二级一片内射视频插放 | av三区在线在线播放 | 国产精品男男视频一区二区三区 |