讨论有没有机器学习大佬指点下?

头像
卡死人
115阅读4评论

Hi 各位好,

由于本人非机器学习领域相关,现遇到问题需要一位熟悉机器学习的大佬指点下:

  1. 推荐一个适用场景的算法
  2. 介绍下该算法的使用方式
  3. 解答一些疑问

问题如下:
现有数据集包含单个连续变量输入(X)和单个连续变量输出(Y),以及对应时长(T)。

观测数据,整体不为线性关系,但在自变量的分段范围内,因变量与自变量为线性关系。
例:

| X | 0 | 50 | 100 | 150 | 200 | 300 |
| --- | --- | --- | --- | --- | --- |
| Y | 26 | 24 | 24 | 22 | 22 | 18 |

若X=25, Y = (26+24)/2 =25
若X=50, Y = 24
若X=250, Y = (22+18)/2=20

尝试过加权线性回归,但是没法拟合所有数据,所以希望能够找到更合适的回归方法

讨论话题:
想法&创意
城市:
广州
收藏
举报
加载中…
精选评论
头像
等级0

既然分段内线性,分段线性回归 ?

有考虑过,只是分段间隔不固定。由于数据量比较大,这种人为切割的方案可能也不是最佳的。感谢!

头像
等级0
  1. 可以改数据,就是做feature engineering。 比如你有一个x,你可以尝试x2,x3,logx,ax,max(x)...然后再把这些作为x的维度一并输入到加权线性回归。
  2. 如果是时序的,像你说的,更像Yt 与(Yt-1 ,Yt-2| Xt)存在关系,与X区间存在关系,这种时许的应该用ARIMA模型吧。
  3. 各种Deep Learning模型,因为深度学习自带非线性变换(sigmoid,relu),所以可以拟合非线性函数组合(太复杂的效果也不太好,还是要做数据增强)

感谢!虽然很多都没看懂。。另外您没有留联系方式,请问能联系沟通下么?可以的话怎么联系呢?