{“id”:“https://openalex.org/W4281621664“,”doi“:”https://doi.org/10.48550/arxiv.2205.13248“,”title“:”Short Video Recommendation的约束强化学习“,”display_name“:”Short Video-Recommendion的约束强化教学“,”publication_year“:2022,”publiation_date“:”2022-01-01“,”ids“:{”openalex“:”https://openalex.org/W4281621664“,”doi“:”https://doi.org/10.44850/arxiv.2205.13248网址“},”language“:”en“,”primary_location“:{”is_oa“:true,”landing_page_url“:”https://arxiv.org/abs/2205.13248“,”pdf_url“:null,”source“:{”id“:”https://openalex.org/S4306400194“,”display_name“:”arXiv(康奈尔大学)“,”issn_l“:null,”issn“:null,”is_oa“:true,”is_ in_doaj“:false,”host_organization“:”https://openalex.org/I205783295“,”“host_organization_name”:“康奈尔大学”,“host_organization_lineage”:[“https://openalex.org/I205783295“],”host_organization_lineage_names“:[”康奈尔大学“],“type”:“repository”},“license”:“cc-by”,“licence_id”:“https://openalex.org/licenses/cc-by“,”version“:”submittedVersion“,”is_accepted“:false,”is_published“:false},”type“:”preprint“,”type_crossref“:“posted-content”,”indexed_in“:[”arxiv“,”datacite“],”open_access“:{”is_oa“:true,”oa_status“:”green“,”oa_url“:”https://arxiv.org/abs/2205.13248“,”any_repository_has_fulltext“:true},”authorships“:[{”author_position“:”第一“,”作者“:{”id“:”https://openalex.org/A5016589992“,”display_name“:”蔡庆鹏“,”orcid“:”https://orcid.org/0000-0001-6451-9299“},”机构“:[],”国家“:[[],”is_corresponding“:false,”raw_author_name“:”蔡庆鹏“,”raw关联字符串“:[]},{“author_position”:“middle”,“author”:{“id”:“https://openalex.org/A5053491985“,”display_name“:”若翰战“,”兽人“:”https://orcid.org/0000-0002-3426-2784“},”机构“:[],”国家“:[[],”is_corresponding“:false,”raw_author_name“:”詹,若翰“,”raw关联字符串“:[]},{“author_position”:“middle”,“author”:{“id”:“https://openalex.org/A5088141052“,”display_name“:”张弛“,”orcid“:”https://orcid.org/0000-0001-8513-3328“},”机构“:[],”国家“:[[],”is_corresponding“:false,”raw_author_name“:”张,池“,”raw关联字符串“:[]},{“author_position”:“middle”,“author”:{“id”:“https://openalex.org/A5057732263“,”display_name“:”Z.Jiao“,”orcid“:”https://orcid.org/0000-0002-6121-9300“},”机构“:[],”国家“:[[],”is_corresponding“:false,”raw_author_name“:郑洁”,“raw_affiliation_strings”:[]},{“author_position”:“middle”,“author”:{“id”:“https://openalex.org/A5079724253“,”display_name“:”Guangwei Ding“,”orcid“:”https://orcid.org/0000-0002-1153-2649“},”机构“:[],”国家“:[[],”is_corresponding“:false,”raw_author_name“:”丁光伟“,”raw关联字符串“:[]},{“author_position”:“middle”,“author”:{“id”:“https://openalex.org/A5050867621“,”display_name“:”Pinghua Gong“,”orcid“:null},”institutions“:[],”countries“:[],”is_corresponding“:false,”raw_author_name“:”Gong,Pinghui“,”raw _affiliation_strings“:]},{”author_position“:”middle“,”author“:{”id“:”https://openalex.org/A5000336592“,”display_name“:”董正“,”orcid“:”https://orcid.org/0000-0003-2111-3007“},”机构“:[],”国家“:[[],”is_corresponding“:false,”raw_author_name“:”郑,董“,”raw关联字符串“:[]},{“author_position”:“last”,“author”:{“id”:“https://openalex.org/A5060052615“,”display_name“:”彭江“,”orcid“:”https://orcid.org/0000-0002-5387-7952“},”机构“:[],”国家“:[[],”is_corresponding“:false,”raw_author_name“:”蒋,彭“,”raw关联字符串“:[]}],”countries_distict_count“:0,”机构区分计数“:0“”cited_by_percentile_year“:{“min”:67,“max”:76},“biblio”:{卷:null,“问题”:nullhttps://openalex.org/T10462“,”display_name“:”强化学习算法“,”score“:0.8682,”subfield“:{”id“:”https://openalex.org/subfields/1702“,”display_name“:”人工智能“},”字段“:{”id“:”https://openalex.org/fields/17“,”display_name“:”Computer Science“},”domain“:{”id“:”https://openalex.org/domains/3“,”display_name“:”物理科学“}},”主题“:[{”id“:”https://openalex.org/T10462“,”display_name“:”强化学习算法“,”score“:0.8682,”subfield“:{”id“:”https://openalex.org/subfields/1702“,”display_name“:”人工智能“},”字段“:{”id“:”https://openalex.org/fields/17“,”display_name“:”Computer Science“},”domain“:{”id“:”https://openalex.org/domains/3“,”display_name“:”物理科学“}},{”id“:”https://openalex.org/T10603“,”display_name“:”智能电网中的需求响应“,”score“:0.7592,”subfield“:{”id“:”https://openalex.org/subfields/2208“,”display_name“:”电气与电子工程“},”字段“:{”id“:”https://openalex.org/fields/22“,”display_name“:”Engineering“},”domain“:{”id“:”https://openalex.org/domains/3“,”display_name“:”物理科学“}},{”id“:”https://openalex.org/T11197“,”display_name“:”网络游戏的社会和心理方面“,”score“:0.7403,”subfield“:{”id“:”https://openalex.org/subfields/3312“,”display_name“:”社会学和政治学“},”field“:{”id“:”https://openalex.org/fields/33“,”display_name“:”社会科学“},”域“:{”id“:”https://openalex.org/domains/2“,”display_name“:”社会科学“}}],”关键词“:[{”id“:”https://openalex.org/keywords/reinforcement-learning网站“,”display_name“:”强化学习“,”score“:0.55843}],”concepts“:[{”id“:”https://openalex.org/C41008148,“wikidata”:https://www.wikidata.org/wiki/Q21198“,”display_name“:”计算机科学“,”level“:0,”score“:0.84107065},{”id“:”https://openalex.org/C106189395,“wikidata”:https://www.wikidata.org/wiki/Q176789“,”display_name“:”Markov决策过程“,”level“:3,”score“:0.76356053},{”id“:”https://openalex.org/C2780586970,“wikidata”:https://www.wikidata.org/wiki/Q1357284“,”display_name“:”人气“,”level“:2,”score“:0.6916108},{”id“:”https://openalex.org/C97541855,“wikidata”:https://www.wikidata.org/wiki/Q830687“,”display_name“:”强化学习“,”level“:2,”score“:0.67382956},{”id“:”https://openalex.org/C71901391,“wikidata”:https://www.wikidata.org/wiki/Q7126699“,”display_name“:”Upload“,”level“:2,”score“:0.67086375},{”id“:”https://openalex.org/C557471498,“wikidata”:https://www.wikidata.org/wiki/Q554950“,”display_name“:”推荐系统“,”level“:2,”score“:0.563362},{”id“:”https://openalex.org/C98045186,“wikidata”:https://www.wikidata.org/wiki/Q205663“,”display_name“:”Process(computing)“,”level“:2,”score“:0.5494189},{”id“:”https://openalex.org/C2776036281,“wikidata”:https://www.wikidata.org/wiki/Q48769818“,”display_name“:”约束(计算机辅助设计)“,”level“:2,”score“:0.4724731},{”id“:”https://openalex.org/C49774154,“wikidata”:https://www.wikidata.org/wiki/Q131765“,”display_name“:”Multimedia“,”level“:1,”score“:0.3879643},{”id“:”https://openalex.org/C159886148,“wikidata”:https://www.wikidata.org/wiki/Q176645“,”display_name“:”Markov过程“,”level“:2,”score“:0.38141644},{”id“:”https://openalex.org/C119857082,“wikidata”:https://www.wikidata.org/wiki/Q2539“,”display_name“:”机器学习“,”level“:1,”score“:0.29577196},{”id“:”https://openalex.org/C136764020,“wikidata”:https://www.wikidata.org/wiki/Q466“,”display_name“:”万维网“,”级别“:1,”分数“:0.18775842},{”id“:”https://openalex.org/C78519656,“wikidata”:https://www.wikidata.org/wiki/Q101333“,”display_name“:”机械工程“,”level“:1,”score“:0.0},{”id“:”https://openalex.org/C15744967,“wikidata”:https://www.wikidata.org/wiki/Q9418“,”display_name“:”心理学“,”等级“:0,”分数“:0.0},{”id“:”https://openalex.org/C77805123,“wikidata”:https://www.wikidata.org/wiki/Q161272“,”display_name“:”社会心理学“,”level“:1,”score“:0.0},{”id“:”https://openalex.org/C105795698,“wikidata”:https://www.wikidata.org/wiki/Q12483“,”display_name“:”Statistics“,”level“:1,”score“:0.0},{”id“:”https://openalex.org/C33923547,“wikidata”:https://www.wikidata.org/wiki/Q395“,”display_name“:”数学“,”等级“:0,”分数“:0.0},{”id“:”https://openalex.org/C127413603,“wikidata”:https://www.wikidata.org/wiki/Q11023“,”display_name“:”工程“,”级别“:0,”分数“:0.0},{”id“:”https://openalex.org/C111919701,“wikidata”:https://www.wikidata.org/wiki/Q9135“,”display_name“:”操作系统“,”level“:1,”score“:0.0}],”mesh“:[],”locations_count“:2,”location“:[{”is_oa“:true,”landing_page_url“:”https://arxiv.org/abs/2205.13248“,”pdf_url“:null,”source“:{”id“:”https://openalex.org/S4306400194“,”display_name“:”arXiv(康奈尔大学)“,”issn_l“:null,”issn“:null,”is_oa“:true,”is_ in_doaj“:false,”host_organization“:”https://openalex.org/I205783295“,”“host_organization_name”:“康奈尔大学”,“host_organization_lineage”:[“https://openalex.org/I205783295“],”host_organization_lineage_names“:[”康奈尔大学“],“type”:“repository”},“license”:“cc-by”,“licence_id”:“https://openalex.org/licenses/cc-by“,”version“:”submittedVersion“,”is_accepted“:false,”is_published“:false},{”is_oa“:false,”landing_page_url“:”https://api.datacite.org/dois/10.48550/arxiv.2205.13248“,”pdf_url“:null,”source“:{”id“:”https://openalex.org/S4393179698“,”display_name“:”DataCite API“,”issn_l“:null,”issn“:null,”is_oa“:true,”is_ in_doaj“:false,”host_organization“:”https://openalex.org/I4210145204“,”“host_organization_name”:“DataCite”,“host_organization_lineage”:[“https://openalex.org/I4210145204“],”host_organization_lineage_names“:[”DataCite“],“type”:“metadata”},“license”:null,“licence_id”:null,“version”:null}],“best_oa_location”:{“is_oa”:true,“landing_page_url”:“https://arxiv.org/abs/2205.13248“,”pdf_url“:null,”source“:{”id“:”https://openalex.org/S4306400194“,”display_name“:”arXiv(康奈尔大学)“,”issn_l“:null,”issn“:null,”is_oa“:true,”is_ in_doaj“:false,”host_organization“:”https://openalex.org/I205783295“,”“host_organization_name”:“康奈尔大学”,“host_organization_lineage”:[“https://openalex.org/I205783295“],”host_organization_lineage_names“:[”康奈尔大学“],“type”:“repository”},“license”:“cc-by”,“licence_id”:“https://openalex.org/licenses/cc-by“,”version“:”submittedVersion“,”is_accepted“:false,”is_published“:false},”可持续发展目标“:[{”display_name“:”和平、正义和强大的机构“,”score“:0.76,”id“:”https://metadata.un.org/sdg/16“}],”grants“:[],”datasets“:[],”versions“:[】,”referenced_works_count“:0,”referrenced_works“:],”related_work斯“:[”https://openalex.org/W3168977894","https://openalex.org/W3096874164","https://openalex.org/W2937181779","https://openalex.org/W2922107804","https://openalex.org/W2386410636","https://openalex.org/W2357975469","https://openalex.org/W2341346307","https://openalex.org/W2145363145","https://openalex.org/W1985560493","https://openalex.org/W1626977535“],”ngrams_url“:”https://api.openalex.org/works/W4281621664/ngrams“,”abstract_inverted_index“:{“The”:[0],“wide”:[1],“popularity”:[2],“of”:[3,36,59,71,90100105169182204210222],“short”:[4,72211],“videos”:[5],“on”:[6,18125173244],“social”:[7],“media”:[8],“poses”:[9],“new”:[10,57],“opportunities”:[11],“and”:[12,2533153225],“challenges”:[13],“到”:[14,54,85135147157240],“优化”:[15,86136149241],“recommender”:[16],“systems”:[17],“the”:[19,69,87,98102114150161167174190197202237245],“video-sharing”:[20],“platforms.”:[21],“Users”:[22],“provide”:-23],“complex”:[24],“multi-faceted”:[26],“responses”:[27104],“to”:[28],“reconommendations,”:[29213],“including”:[30],“watch”:=31,92223],“time”:[32,93224],“各种”:[34],“类型”:[35],“交互”:[37107226],“与”:[38,97],“视频。”:[39111],“作为”:[40],“a”:[41,48,76119145],“结果”:[42],“建立”:[43],“建议”:[44,74],“算法”:[45],“that”:[46],“关注”:[47],“单一”:[49],“目标”:[50],“是”:[51],“不是”:[52],“足够”:[53],“满足”:[55],“this”:[56,65170],“demand”:[58],“optimization”:[60189],“comprehensive”:[61],“用户”:[62,91106242],“体验”:[63],“In”:[64],“论文”:[66],“我们”:[67117131143179],“公式”:[68],“问题”:[70],“视频”:[73212228],“as”:[75109193195],“受限”:[77115],“马尔可夫”:[78],“决策”:[79],“过程”:[80],“(MDP),”:[81],“其中”:[82214],“平台”:[83],“想要”:[84],“主要”:[88151171191],“目标”:[89192],“In”:[94187207220236],“长”:[95],“术语”,:[96],“约束”:[99],“调节”:[101],“辅助”:[103138],“这样”:[108],“共享/下载”:[110],“到”:[112],“求解”:[113],“MDP,”:[116],“提议”:[118],“两阶段”:[120],“强化”:[121],“学习”:[122],“方法”:[123184206231],“基于”:[124],“actor-critic”:[126],“framework”:[127],“At”:[128140],“阶段”:[129141],“一个”,:[130],“学习”:[132144],“个人”:[133],“政策”:[134158],“每个”:[137],“回应”:[139],“两个”:[142],“策略”:[146172],“(i)”:[148],“响应”:[152],“二)”:%154],“停留”:[155],“关闭”:[156],“学会”:[159],“在”:[160],“第一”:[162],“阶段”,:[163],“其中”:[164],“有效”:[165],“保证”:[166],“性能”:[168],“辅助设备”:[175],“通过”:[176],“广泛”:[177],“模拟”:[178],“演示”:[180],“有效性”:[181],“我们的”:[183205],“超过”:[185],“备选方案”:[186],“两者”:[188],“好”:[194],“平衡”:[196],“其他”。“:[198],”我们“:[199],“进一步”:[200],“显示”:[201],“优势”:[203],“直播”:[208],“实验”:[209],“it”:[215],“显著”:[216],“优于预期”:[217],“其他”:[218],“基线”:[219],“术语”:[221],“来自”:[227],“视图”:[229],“我们的”:[230],“已经”:[232],“被”:[233],“完全”:[234],“启动”:[235],“生产”:[238],“系统”:[239],“经验”:[243],“平台”:[246]},“引用_b y_api_url“:”https://api.openalex.org/works?filter=cites:W4281621664“,”counts_by_year“:[{”年“:2023,”引用_by_count“:1}],”更新日期“:”2024-06-09T22:47:12.931248“,”创建日期“:“2022-06-13”}“