Coding,the witchery of the real world

0%

生成1

Task

对于给定的商品信息以及商品所属评论,生成侧重于商品属性的仿真评论

思路

 • 对于商品信息进行转化,将属性转化成描述性语句,生成对应属性不同态度下的评论
 • 句法结构的抽取,按照结构填充需要的内容
  • 先手动生成一个差不多的模板跑起来
  • 考虑从评论语料中提取能用的东西
   • 句子结构
   • 常用词
   • 评论模板

选择数据集

比较有感觉的电脑相关商品评论和商品信息亚马逊数据集

属性相关

 • 属性转化
 • 从feature和description中抽取语料
  • 细类/属性描述词
 • 考虑只保留PC/Tablet
  • 四个系统(Linux/Windows/Macintosh/Android)
  • 多种特性(高性能/续航/轻薄/屏幕素质/大内存/信仰/颜值/)
 • a stupid search
  • 从评论中找属性(Problem/advantages/Screen/(Intel/AMD)/GB/MB
  • 对附近的短句做处理
 • 通用的构建描述集合(对于不同属性不同状态的不同描述)

生成相关

初步

 • 构建模板config
 • 根据态度,商品选择
 • 看情况选择好属性差属性组合
 • 根据句法结构填充

进一步的

 • Rule-based + 从评论中抽取到的内容
 • 丰富属性相关中生成的模板
  • 知识库
  • 评论抽取
  • 模板组合
  • etc.
 • Data2seq
  • 模板选取打分机制
  • 模板生成