Coding,the witchery of the real world

0%

生成1

Task

对于给定的商品信息以及商品所属评论,生成侧重于商品属性的仿真评论

思路

  • 对于商品信息进行转化,将属性转化成描述性语句,生成对应属性不同态度下的评论
  • 句法结构的抽取,按照结构填充需要的内容
    • 先手动生成一个差不多的模板跑起来
    • 考虑从评论语料中提取能用的东西
      • 句子结构
      • 常用词
      • 评论模板

选择数据集

比较有感觉的电脑相关商品评论和商品信息亚马逊数据集

属性相关

  • 属性转化
  • 从feature和description中抽取语料
    • 细类/属性描述词
  • 考虑只保留PC/Tablet
    • 四个系统(Linux/Windows/Macintosh/Android)
    • 多种特性(高性能/续航/轻薄/屏幕素质/大内存/信仰/颜值/)
  • a stupid search
    • 从评论中找属性(Problem/advantages/Screen/(Intel/AMD)/GB/MB
    • 对附近的短句做处理
  • 通用的构建描述集合(对于不同属性不同状态的不同描述)

生成相关

初步

  • 构建模板config
  • 根据态度,商品选择
  • 看情况选择好属性差属性组合
  • 根据句法结构填充

进一步的

  • Rule-based + 从评论中抽取到的内容
  • 丰富属性相关中生成的模板
    • 知识库
    • 评论抽取
    • 模板组合
    • etc.
  • Data2seq
    • 模板选取打分机制
    • 模板生成