Classes

week's work

By 雷玮杰

Github

调研时暂时的搜索关键词::e-commence, commodity/commodities’/~~ comment generation, comment analysis, nature language generation,etc.

基于人工智能的评论生成方法及装置、设备与可读介质

image-20191204102011161

动机:

自动生成评论语句

任务:

结合预设语料库和目标主题,选用更合适扣题的分词,生成主题对应的评论语句

方法:

候选词挖掘模型

评估分值的方法:对齐模型

image-20191204102509484

输入:(前置的语料库),主题,一些评论

输出:扣题的评论中词的替换生成的新评论们

数据集:False

语料库,评论替换,候选词评估

LEARNING COMMENT GENERATION BY LEVERAGING USER-GENERATED DATA

image-20191204103800107

动机:

Propose a combined approach to retrieval and generation methods

任务:

利用用户的数据(评论等)结合文章一起通过sequence2sequence序列模型改善评论的生成。

方法:

  • a standard information retrieval(IR)-based method
  • generation-based method
  • 具体分为
    • Comment Scorer
      • a relevance scorer(RS)
      • an upvote scorer(US)
      • an ensemble of both(ES)
    • Information Retrieval-based Commenting
      • IR+TF-IDF词袋
    • Generation-based Commenting

输入:文章和评论

输出:

image-20191204105443090

数据集:腾讯新闻的一个数据集

综合真实的评论数据来搞,

Coherent Comment Generation for Chinese Articles with a Graph-to-Sequence Model

image-20191204173515230

动机:

propose to generate comments with a graph-to-sequence model that models the input news as a topic interaction graph.

任务:

将文章重新整合成图结构,更好理解文章结构和主题之间的关系

方法:

  • Graph Construction
  • Vertex Encoder
  • Graph Encoder

输入:新闻文章

输出:评论

数据集:来自于腾讯新闻

GitHub:

https:://github.com/lancopku/Graph-to-seq-comment-generation

graph2seq

‘’'

电商方向的文章暂时找到的基本上都是国内的偏向评论内容分析的

关于评论生成的,美团,点评,推荐内容服务公司的技术博客也可以关注一下

可以进一步去看的几个数据集可能来源:

Kaggle,阿里天池,腾讯AI Lab,京东JDD空间站,IBM美食点评那个,ebay pulsar,一些数据竞赛,平台之类的相关数据集

爬一下应该问题也不大,不过反爬虫机制可能也有点难搞,只有selenium来弄了

‘’'